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摘要 


ChatGPT 是 由 OpenAl 公司 研发 的 对 话 系 统 。 它 的 对 外 表现 是 一 个 聊天 机 器 人 ， 实 际 本 质 是 人 
工 智 能 生成 技术 ， 关 键 基 础 是 基于 生成 式 预 训练 的 变换 器 ， 核 心 技术 是 InstructGPT， 主 要 特 
点 是 与 前 期 类 似 产 品 相 比 ， 编 造 事实 大 幅 下 降 ， 生 成 的 毒 内 容 更 少 。 本 文 从 ChatGPT 的 技术 
体系 、 相 关 研 究 与 实践 、 应 用 情况 等 方面 进行 了 系统 的 调研 。 分 析 了 人 工 智 能 技术 迅速 发 展 带 
来 的 启示 与 ChatGPT 对 科学 研究 和 文献 情报 工作 的 影响 ,提出 了 对 文献 情报 领域 的 八条 建议 。 
总 体 来 说 ， 文 献 情报 领域 在 AI 时 代 要 找到 自己 的 不 同 价值 取向 ， 既 要 守 正 继承 传统 科学 研究 
范式 ， 也 要 拓展 以 ChatGPT 等 新 技术 助力 科学 研究 。 
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Abstract 


ChatGPT is a dialogue system developed by OpenAI company. It appears as a Chatbot, but in 
essence, it uses Artificial Intelligence Generated Content (AIGC) technology to produce answers. Its 
key foundation is Generative Pre-trained Transformer and the core technology is InstructGPT. When 
compared to similar products in the early stages, its main characteristic is that there is a significant 
decrease in making up facts and generating toxic content. We present a systematic investigation of 
the technical structure, relevant research and practice, and applications scenarios of ChatGPT. Based 
on the investigation, we analyze the inspiration from the rapid development of AI technology as well 
as the influence of ChatGPT on Scientific Research and Library & Information Service. According to 
these influence, we present eight suggestions for the Library & Information Service field. Overall, 
the field should find its distinctive value orientation in the AI era, not only by maintaining the 
conventional scientific research paradigm, but also by exploring new technologies to boost scientific 


research. 
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Service; Scientific Research 


本 文 由 国家 科技 图 书 文献 中 心 与 中 国 科学 院 文献 情报 中 心 组 织 撰 写 。 

得 到 如 下 项 目的 支持 : 

国家 重点 研发 计划 项 目 : 科技 文献 内 容 深度 挖掘 及 智能 分 析 关 键 技术 和 软件 
国家 社会 科学 基金 重大 项 目 : 大 数据 驱动 的 科技 文献 语义 评价 体系 研究 


1 ChatGPT 的 本 质 和 研发 历程 eat etn cna akabededatahpaeiatatndeictaounuctaa tt Arant raant erant Earann aceon 1 
1.1 ChatGPT 是 什么 ? .sssriirirsririririsiirististietistrtisististrstretinnret rst rrnret rnnr nran 1 
2.ChatGPT 的 WEE .ne ee a 2 
1.3 ChatGPT 语 料 规模 和 算 力 投入 oooeeesseassseseriesseressesttesssetttensrtttesstttenntttnnnnttttnnttttnsrttennrttnntrettntrteenr retenas 3 
1.4 ChatGPT 的 研发 历史 5 

2 ChatGPT 的 技术 体系 分 析 ccasssccsncscsnssccaxssacacestassecosstaceceashacedanssiunsesdxsseoucedeshssussasacensunrocendbancaeassactdanaseueaesenssncantbanncsid 6 
Chat Bs Ws tae Oe cea ieee ace dee ele 6 
ZI AIG | 志 术 是 全 7 

2.2.1 AIGC 模型 简介 8 
2.2.2 大 规模 预 训练 模型 成 为 AIGC 的 发 展 趋势 …. trett: 8 
2.2.3 强化 学 习 的 思路 逐渐 应 用 在 自然 语言 处 理 任务 中 9 
2.3 ChatGPT 利用 人 类 知识 提升 了 原始 语 料 的 真实 性 .55 10 
2.4 利用 生成 式 预 训练 技术 构建 ChatGPT 的 基础 模型 ee 11 
2.4.1 生成 式 预 训练 模型 基础 一 Transformer .5 11 
2.4.2 生成 式 预 训练 模型 一 GPT. oe cece ee eee eee ee eee eee eres 11 
2.5 ChatGPT 是 GPT-3 至 GPT-3.5 众多 模型 迭代 的 结果 .es 12 
2.5.1 GPT-3 模型 的 四 个 版 本 12 
2.5.2 用 于 文本 相关 性 计算 的 Embeddings 模型 13 
2.5.3 用 于 代码 生成 的 Codex 模型 14 
2.5.4 用 于 文本 内 容 修改 的 Insert+Edit 模型 15 


2.5.5 GPT-3.5 系列 模型 ccccccccccsccsccsesscsucsessessessesucsecsessessesucsscsessesussucassasssesusaucassassucsueaucsesassacaueaessesasanenvees 16 


2.6 利用 人 类 反馈 指导 (Instruct) ChatGPT 模型 微调 17 


2.6.1 基于 人 类 反馈 的 强化 学 习 RLHF .ss 17 
2.6.2 RLHF 的 特点 与 优势 19 

2.7 利用 奖励 模型 (RM) 使 ChatGPT 更 接近 人 类 表现 20 
2.7.1 奖励 模型 Reward Model 20 
272RM 的 特 局 与 优 持 veo ee eee ee eee ee eer ee ee eee 21 

2.8 利用 PPO 模型 优化 ChatGPT 的 文本 生成 策略 .es 22 
2.8.1 近 端 策略 优化 模型 PPO 22 
2.8.2 PPO 的 特点 与 优势 ae eee een en eet ener ers errr ety ener rer Terre er ye 23 
3.ChatGPT 相关 人 研究 及 实 卫 0 24 
I 全 /OA ee ee ee ee 24 
32 Ae eee ie dae anand ae andi ae a a eee oaede aie 25 
= 2 || = eee ce ane ee eer ee cee eee eee ee eee ere 25 
SA Ea E 26 
A Ls A E E ere E T eee eer E E E 26 
36 科大 和 机 27 
3 D o E E E EE E E E EE 27 
3.8 DT 360 0 28 
3.9 北京 智 源 研究 院 a ene cere ee eee eee eee eee ee 28 
3.10 ID] NE a ee ee cere er ce ae ee ce ee ere nse ee etre eee eee eee ee 28 
3.11 中 科 院 自动 化 所 29 


3.12 鹏 程 实验 室 socicicacdscuicecddedeecdsuecinesiloveccdduaisicoiddodenodduedsucisdovaycideedgesadladyeetdvedsioedleszeniduedinosSlodenedduatdeonidoexeoetucase 29 


A r N 30 


4 ChatGPT RIM Benine a a a A niani 30 
4.1 ChatGPT 在 科研 领域 的 应 用 30 
1.1,ChatGPT 用 手 生 物化 学 研究 是 31 

4.1.2 ChatGPT 用 于 科研 写作 .0 31 

4.2 ChatGPT 在 教育 领域 的 应 用 .es 32 
4.2.1 ChatGPT 用 于 教学 sitelepagvrcints tertda nas hicloa ude acer le vile aeadonhesikenleapinvag uadasutiivadapissbonsed 32 

4.2.2 ChatGPT 用 于 考试 33 

4.3 ChatGPT 在 医疗 领域 的 应 用 33 
4.3.1 ChatGPT 用 于 报告 编写 和 信息 提取 .0 34 

4.3.2 ChatGPT 用 于 诊断 决策 和 分 流 … 34 

4.3.3 .ChatGPT 用 手 医 串 沟通 有 35 

4.4 ChatGPT 在 信息 领域 的 应 用 .......csssssesseccscsssssssscsecsessesossscsecsucsesossacsucsucsesossacsucsucsesossassecsucsesessassecsucsesassass 35 
.4:1:ChatG@PT 用 于 搜索 引 过 eee eee ee een a eee eee nee enna 35 

4.4.2 ChatGPT 用 于 代码 生成 和 错误 修复 oe eccccessessesscsessessessesscsessessessesecsusseeseesceessesseeseenssesseeasensenses 36 

4.5 ChatGPT 在 其 他 领域 的 应 用 .es 36 
4.5.1 ChatGPT 用 于 内 容 创 作 .0 36 

4.5.2 ChatGPT 用 于 游戏 角色 37 

4.5.3 ChatGPT 用 于 电 商 营销 、 智 能 客服 oo. ecceccsessesseseeseesecsecscsnsseeseenecucsnsseesecneenesnsseeseensenesesseeaeenees 37 

4.5.4 ChatGPT 用 于 工业 领域 任务 排 班 .4 38 

5 人 工 智能 技术 迅速 发 展 带 来 的 启示 .……… insatt irsann irant traan n rran n rnant rt 38 


5.1 计算 机 解决 问题 模式 已 改变 ， 机 器 学 习 成 为 获取 解决 问题 所 需 知识 的 重要 手段 … 39 


5.2 深度 学 习 的 性 能 提升 ， 除 模型 突破 之 外 ， 更 要 归功 于 语 料 和 得 力 … 39 


5.3 自然 语言 处 理 的 技术 已 经 重 写 ， 无 监督 的 预 训练 对 于 知识 学 习 有 重要 价值 … 39 

5.4 ChatGPT 并 不 是 无 来 由 的 横 空 出 世 ， 而 是 学 习 能 力 从 量变 到 质变 的 重大 突破 .pp 40 

5.5 ChatGPT 是 集成 创新 的 成 果 ， 学 习 能 力 的 提升 得 益 于 软件 、 硬 件 、 技 术 、 语 料 的 有 效 集成 ………. 40 

6 ChatGPT 对 科学 研究 和 文献 情报 工作 的 影响 oo cccccssseeeccccsssseescccesssnessccsssnnnsseccsssnnseeccsssnnssceccsssnsseceessnneeeecessnees 40 
6.1 ChatGPT 对 科学 研究 的 影响 ccccccistiecacescussieccSdevssotdscctnesdlacsocatuaverssdleseetdsedtnssdlasheontuadeescdhedeeesSsesbessdlosaeondudes 41 
6.1.1 改变 科学 研究 范式 ， 推 动 科 学 研究 从 第 四 范式 到 新 科研 范式 pe 41 

6.1.2 改变 科学 研究 知识 获取 模式 ， 促 进 检索 模式 向 问答 模式 升级 .ee 41 

6.1.3 改变 科学 研究 实验 设计 模式 ， 辅 助 进 行 实验 规 划 和 设计 .5 42 

6.1.4 改变 科学 研究 成 果 写 作 模 式 ， 为 成 果 论文 撰写 提供 帮助 42 

6.1.5 带 来 科研 伦理 问题 ， 须 建立 健全 政策 法 规 .5 42 

6.2 ChatGPT 对 文献 情报 工作 的 影响 .550 43 
6.2.1 改变 文献 情报 数据 组 织 方式 ， 从 表面 信息 组 织 到 语义 内 容 组 织 …..5.5 43 

6.2.2 改变 文献 情报 知识 获取 模式 ， 从 信息 检索 到 知识 问答 … 44 

6.2.3 改变 文献 情报 分 析 方 法 ， 从 手工 作坊 到 大 规模 智能 分 析 ……55 44 

6.2.4 带 来 文献 情报 服务 安全 问题 ， 须 建立 风险 管控 机 制 .5 44 

6.2.5 对 用 户 阅 读 习 惯 的 影响 ， 引 导 人 机 协同 阅读 新 模式 45 

6.2.6 对 传统 图 书 情报 工作 形成 挑战 ， 需 要 统筹 襄 划 图 书馆 的 队伍 能 力 与 岗位 体系 …………………………… 45 

EDA INELE: NE 46 
7.1 文献 情报 领域 要 把 从 科技 文献 内 容 中 挖掘 和 利用 知识 的 能 力作 为 核心 能 力 来 建设 .pp 46 

7.2 充分 认识 到 文献 情报 机 构 在 AI 时 代 的 优势 和 价值 … 46 


7.3 充分 加 强人 工 智能 新 技术 方法 的 研究 和 应 用 47 


7A 文献 情报 领域 需 积极 参与 “专业 和 垂直 ”知识 系统 建设 47 


7.5 文献 情报 领域 要 努力 创新 知识 服务 模式 47 
7.6 应 用 ChatGPT 在 情报 研究 工作 上 启发 创意 .0 48 
7.7 EN N EEEo EENE E 48 


7.8 要 进行 数据 资源 、 基 础 设施 、 智 能 技术 一 体 化 的 能 力 建设 48 


1 ChatGPT 的 本 质 和 研发 历程 


1.1 ChatGPT 是 什么 ? 

ChatGPT! (Chat Generative Pre-training Transformer， 对 话 式 生成 型 预 训 练 转 
换 程序 ) 发 布 于 2022 年 11 月 30 日 ， 是 由 OpenAI 公司 研发 的 对 话 系统 。 由 于 
其 能 在 诸多 知识 领域 中 给 出 清晰 、 详 尽 的 答案 ， 甚 至 写 出 接近 真人 撰写 的 文章 ， 
自 推出 后 便 迅 速 获得 关注 ，5 天 内 注册 用 户 数 就 超过 100 万 。 

ChatGPT 是 什么 ， 可 以 从 以 下 五 个 方面 来 把 握 。 

(1) ChatGPT 的 对 外 表现 是 一 个 聊天 机 器 人 。 它 能 够 通过 学 习 和 理解 人 类 
语言 来 与 人 进行 对 话 , 具有 依据 对 话 的 上 下 文 环境 来 回答 问题 的 能 力 ， 就 像 人 一 
样 来 与 人 类 进行 聊天 交流 。 

(2) ChatGPT 的 实际 本 质 是 人 工 智 能 生成 技术 。 它 是 人 工 智 能 内 容 生成 

(Artificial Intelligence Generated Content，AIGC) 技术 的 具体 应 用 。 它 在 学 习 人 
类 语言 和 相关 领域 知识 的 基础 之 上 , 具有 了 智能 化 的 内 容 创作 能 力 , 能 够 自动 生 
成 特定 的 内 容 。 

(3) ChatGPT 的 关键 基础 是 生成 式 大 规模 语言 模型 。 即 基于 生成 式 预 训练 
的 变换 器 (Generative Pre-trained Transformer, GPT) ， 它 以 生成 式 的 自 监督 学 
习 为 基础 ， 从 TB 级 训练 数据 中 学 习 隐 含 的 语言 规律 和 模式 ， 训 练 出 的 干 亿 级 别 
参数 量 的 大 规模 语言 模型 。 

(4) ChatGPT 核心 技术 是 InstructGPT2?。 其 受到 关注 的 重要 原因 是 引入 新 
技术 RLHF3 (Reinforcement Learning with Human Feedback, 即 基于 人 类 反馈 的 强 


2 OpenAl, Aligning Language Models to Follow Instructions. https://openai.com/blog/instruction-following/, 2022. 
3 Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022. 


化 学 习 )。RLHF 解决 了 生成 模型 的 一 个 核心 问题 ， 即 如 何 让 人 工 智能 模型 的 产 
出 和 人 类 的 常识 、 认 知 、 需 求 、 价 值 观 保持 一 致 ， 使 得 ChatGPT 能 够 促进 利用 
人 工 智 能 进行 内 容 创 作 、 提 升 内 容 生产 效率 与 丰富 度 。 

(5) ChatGPT 的 主要 特点 是 与 前 期 类 似 产品 相 比 ， 编 造 事实 大 幅 下 降 ， 生 
成 的 毒 内 容 更 少 。 相 较 于 其 他 对 话 模型 ，ChatGPT 模型 的 重要 价值 在 于 解决 了 传 
统 语言 模型 在 复杂 多 领域 的 知识 利用 “、 演 绎 推理 `、 欺 骗 性 反应 “等 方面 的 缺陷 ， 
具有 语 料 丰富 、 响 应 快速 、 生 成 文本 准确 、 对 话 能 力 强大 的 特点 。ChatGPT 有 效 
减轻 了 神经 语言 模型 生成 文本 的 危害 和 偏见 "， 使 回答 更 加 有 用 和 真实 ， 具 有 编 
造 事 实 大 幅 下 降 , 生成 的 模仿 性 谎言 (imitative falsehoods)、 毒 内 容 (toxic output) 
更 少 的 重要 特征 。 
1.2ChatGPT 的 功能 

ChatGPT 功能 强大 , 适用 于 多 种 应 用 场景 。 我们 结合 已 成 融 的 功能 示例 将 其 
应 用 场景 分 为 智能 问答 、 语 言 转换 和 自然 语言 生成 三 类 。 

(1) 智能 问答 : ChatGPT 实现 对 话 式 交互 的 基本 形式 。 这 种 方式 使 得 
ChatGPT 可 以 深入 回答 同一 情境 的 后 续 问题 , 也 能 在 对 话 过 程 中 纠正 回答 偏差 以 
便 更 贴 合 目标 业务 。 同 时 ， 这 种 方式 也 成 为 了 更 灵活 的 新 型 检索 方式 。 即 使 用 户 
没有 提供 任何 其 所 处 场景 的 信息 , ChatGPT 仍 可 以 根据 其 已 有 的 真理 知识 回答 问 
题 ; 如 果 用 户 提供 了 他 们 所 处 的 场景 信息 ， 比 如 输入 “你 是 一 个 爱 讽刺 别人 的 问 


答 助 手 ”，ChatGPT 将 会 基于 这 个 新 场景 ， 回 答 符合 该 场景 语 境 的 答案 。 


4 Gilson A, Safranek C, Huang T, et al. How Well Does ChatGPT Do When Taking the Medical Licensing Exams? The Implications of Large Language Models for 
Medical Education and Knowledge Assessment[J]. medRxiv, 2022: 2022.12. 23.22283901. 

5 Kung T H, Cheatham M, Medinilla A, et al. Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models[J]. 
medRxiv, 2022: 2022.12. 19.22283643. 

6 Zhuo T Y, Huang Y, Chen C, et al. Exploring AI Ethics of ChatGPT: A Diagnostic Analysis[J]. arXiv preprint arXiv:2301.12867, 2023. 

7 Tamkin A, Brundage M, Clark J, et al. Understanding the capabilities, limitations, and societal impact of large language models[J]. arXiv preprint arXiv:2102.02503, 


2021. 


(2) 语言 转换 : ChatGPT 实现 了 语义 在 不 同 语言 媒介 间 的 转换 。 不 仪 是 传 
统 意义 上 自然 语言 间 的 相互 翻译 , ChatGPT 还 实现 了 编程 语言 与 编程 语言 、 自 然 
语言 与 编程 语言 间 的 相互 转换 ,这 大 幅度 扩展 了 业务 空间 ,可 支持 写 代 码 、 读 代 
码 、 翻 译 等 功能 。 

(3) 自然 语言 生成 : 除了 回答 事实 性 问题 、 进 行 不 同 语言 的 转换 , ChatGPT 


的 另 一 大 价值 是 可 以 进行 一 定 的 内 容 创造 。 这 包括 三 种 任务 类 型 : 一 是 从 繁 到 简 


Bt 


的 概述 任务 ， 如 概述 资料 ， 即 ChatGPT 可 以 辅助 用 户 从 纷繁 的 信息 中 总 结 要 点 


e 


并 快速 理解 信息 ; 二 是 从 无 到 有 的 创造 任务 ， 如 构建 论文 提纲 ， 即 辅助 用 户 生成 
符合 情境 要 求 的 草稿 大 纲 ; 三 是 从 少 到 多 的 扩充 任务 , 如 撰写 故事 , 即 ChatGPT 
可 以 辅助 用 户 从 较 短 的 提示 词 快速 扩充 内 容 。 


表 1-1 ChatGPT 已 解决 的 问题 及 典型 示例 


功能 类 别 阐释 细 分 类 别 典型 示例 
常识 性 问答 知识 问答 、 知 识 库 外 问答 
智能 问答 在 对 话 式 交互 中 深入 与 纠 错 ; 可 能 成 为 具体 场景 问答 讽刺 机 器 人 、 模 拟 牙医 
更 灵活 的 新 型 检索 方式 常规 分 类 问答 实体 类 别 判 断 
情绪 判别 问答 推 文 情绪 检测 
RA 自然 语言 翻译 成 SQL 查询 


Ne 


程 语言 到 自然 语言 的 转 
换 


程 语言 间 的 转换 Python 转换 成 Haskell 


Python 代码 解释 器 


语言 转换 。 实现 了 语义 在 不 同 语言 媒介 间 的 转换 


CN 


自然 语言 间 的 相互 转换 ”多 语言 翻译 
自然 语言 到 特殊 代码 符号 电影 名 称 转换 成 emoji、 心 情 描 述 转 


的 转换 换 成 颜色 代码 
eanna 。 关 岩 站 生成 、 复 杂 定义 通 从 化解、 
产品 名 称 生成 
EE ia et I 从 无 到 有 的 创造 任务 论文 大 纲 生成 、 采 访 提纲 生成 


从 少 到 多 的 扩充 任务 ”恐怖 短 故 事 续 写 、 会 议 笔记 转 为 摘要 


1.3ChatGPT 语 料 规模 和 算 力 投入 


在 OpenAI 成 立时 ， 其 认 捐 资金 为 10 亿美 元 '。 微 软 在 2019 年 向 OpenAI LP 
提供 了 10 亿美 元 的 投资 , 并 在 2023 年 1 月 进行 了 第 二 次 多 年 投资 。 数 十 亿 的 投 
资 背景 让 OpenAl 在 前 几 年 没有 营 收 压力 , 可 以 专注 于 技术 研发 , 为 ChatGPT 这 
一 大 型 语言 模型 提供 了 资金 支持 。 据 媒体 报道 ，OpenAI 为 ChatGPT 投入 了 大 约 

每 年 25 亿美 元 ”。 

在 数据 资源 与 计算 资源 上 ，OpenAI 并 未 公开 训练 ChatGPT 的 相关 数据 集 来 
源 和 具体 细节 。 根 据 OpenAl 官方 信息 2"，ChatGPT 的 训练 数据 与 其 同 级 模型 
InstructGPT 模型 相似 ， 都 是 在 GPT-3 等 模型 的 数据 基础 上 改进 优化 而 来 的 。 

ChatGPT 在 GPT-3 的 数据 基础 上 做 了 进一步 的 增加 ”…。GPT32 的 数据 集 
由 Common Crawl、WebText2、Books1、Books2、Wikipedia 五 个 子 数 据 集 组 成 ， 
其 中 仅 Common Crawl 的 数据 集 大 小 就 达到 了 570GB。 为 了 提高 数据 的 质量 ， 
ChatGPT 还 重点 增加 了 人 工 标注 的 问答 数据 , 这 些 数据 来 源 于 人 工 标注 与 早期 用 
户 的 提交 。 该 数据 集 圳 括 了 生成 、 开 放 问 答 、 聊 天 、 摘 要 、 重 写 、 分 类 等 超过 9 
种 数据 类 型 , 以 对 应 人 类 常见 的 聊天 情景 。 同时 , 该 数据 集 还 涵盖 了 20 种 语言 ， 
包括 英语 、 汉 语 、 法 语 、 西 班 牙 语 等 。 不 过 ， 由 于 英文 数据 集 占 96% 以 上 ,导致 
了 在 非 英 语 环境 中 表现 还 有 所 欠缺 。 

根据 OpenAI 的 论文 , 仅 GPT-3 的 训练 硬件 就 包括 了 285000 多 个 CPU 内 核 、 
10000 个 GPU 和 每 个 GPU 服务 器 每 秒 400GB 的 网 络 链接 。 据 估算 ,GPT-3 的 训 


练 成 本 将 接近 1200 DET". 
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11 Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022. 
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1.4ChatGPT 的 研发 历史 

ChatGPT 是 在 GPT 系列 模型 的 基础 上 研发 ， 历 经 四 年 迭代 而 来 。 

GPT-1 (Generative Pre-training Transformer) F 2018 年 6 月 公布 。GPT-1 
侧重 生成 式 任务 ”， 一 经 问世 就 被 证 明 在 语言 推理 、 文 本 生成 、 问 答 等 任务 中 表 
现 出 色 。GPT-1 模型 的 参数 数量 高 达 1.17 亿 ， 这 也 是 后 续 几 个 GPT 模型 的 共同 
gm: 在 庞大 的 数据 集 上 通过 半 监 督 、 无 监督 的 方式 训练 大 型 语言 模型 。GPT-2 
产生 于 2019 年 “， 其 核心 思想 可 以 概括 为 : 当 模 型 的 容量 非常 大 有 数据 量 足够 

BA, 仅仅 靠 训练 语言 模型 的 学 习 便 可 以 完成 其 他 有 监督 学 习 的 任务 '。 此 外 ， 
GPT-2 还 使 用 了 Prompt( 文 本 提示 ) 的 方式 (但 这 不 是 GPT-2 第 一 个 提出 , 而 是 参 
ZT 18 年 的 一 篇 论文 “) 。2020 年 OpenAl 发 布 的 GPT-3 模型 拥有 更 多 的 参数 、 
更 大 的 网 络 容 量 和 更 加 丰富 的 主题 文本 。 GPT-3 已 经 能 够 将 网 页 描述 转换 为 相应 
代码 、 模 仿 人 类 和 叙事、 创作 定制 诗歌 、 生 成 游戏 剧本 等 。 然 而 在 实际 应 用 上 ， 它 
无 法 分 辨 文本 好 坏 ， 会 生产 出 错误 的 、 恶 意 冒 犯 的 、 甚 至 是 攻击 性 的 文本 输出 。 

为 了 解决 GPT-3 在 实际 问答 应 用 中 的 缺陷 ，2021 年 未 ，OpenAI 发 布 了 
WebGPT "。 研 究 人 员 通 过 让 模型 学 习 人 类 回答 问题 的 方式 ， 训 练 奖励 模型 来 预 
测 人 类 偏好 ,并 使 用 强化 学 习 或 拒绝 采样 来 进行 优化 ,从 而 提高 模型 回答 的 可 用 
性 和 准确 性 ,微调 后 的 WebGPT 模 型 可 以 对 人 类 实时 回答 问题 的 方法 进行 学 习 ， 
比如 提交 搜索 、 跟 踪 链 接 并 上 下 滚动 网 页 。 但 模型 仍 存在 一 些 问 题 , 例如 模型 更 
倾向 于 对 已 有 知识 进行 强化 而 非 产 生 新 知识 ， 生 成 的 回答 会 犯 一 些 基 本 错误 等 。 
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2022 年 初 ，OpenAI 发 布 了 ChatGPT 的 同 级 模型 mstructGPT20， 在 训练 过 程 中 使 
用 了 人 类 作为 “教师 ”， 对 模型 训练 进行 反馈 和 指导 ,以 降低 模型 凭空 捏造 或 输出 
偏见 的 概率 。 于 2022 年 12 月 发 布 的 ChatGPT*! 同 样 采 用 了 基于 人 类 反馈 的 强化 
学 习 。 但 不 同 的 是 ，ChatGPT 模型 有 多 个 输出 ， 而 InstructGPT 只 有 一 个 。 在 此 
基础 上 , 通过 让 模型 学 习 人 类 对 输出 结果 的 排序 方式 ,ChatGPT 可 以 更 好 地 进行 
上 下 文学 习 和 对 话 ， 从 而 生成 更 符合 人 类 期 望 的 反馈 。 


2 ChatGPT 的 技术 体系 分 析 

了 解 ChatGPT 的 底层 原理 对 于 在 各 个 领域 中 充分 利用 它 的 技术 潜力 至 关 重 
要 。 本 节 将 详细 介绍 ChatGPT 的 整体 技术 体系 、 模 型 基础 染 构 以 及 核心 技术 原 
理 。 
2.1ChatGPT 的 整体 技术 体系 

ChatGPT 是 GPT-3.5 的 微调 版 本 “， 是 使 用 RLHF (基于 人 类 反馈 的 强化 学 
习 ) 训 练 的 文本 生成 式 的 对 话机 器 人 , 它 以 自 监督 预 训练 的 生成 式 大 模型 为 基础 ， 
采用 少量 优质 数据 强化 学 习 反 馈 策略 , 实现 了 更 加 符合 人 类 期 望 的 、 编 造 事 实 大 
幅 下 降 的 、 生 成 的 毒 内 容 更 少 的 对 话 效果 。 

下 文 将 从 AIGC (AI Generate Content) 的 相关 技术 、ChatGPT 的 数据 基础 、 
生成 式 预 训 练 技术 、ChatGPT 如 何 用 人 类 反馈 指导 模型 训练 、 如何 使 模型 表现 更 
接近 人 类 等 方面 展开 讨论 。 


20 OpeanAi, Aligning Language Models to Follow Instructions, [EB/OL] https://openai.com/blog/instruction-following/ 
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利用 奖励 模型 (RM) 
使 模型 更 接近 人 类 表现 


利用 近 端 策略 优化 (PPO 
及 时 优化 生成 策略 


利用 人 类 反馈 
= 和 指导 (Instruct) 模型 训练 


数据 基础 。 Z-Z 基 于 人 类 反 鲁 的 强化 学 习 (RLHP dd _ 
人 类 评估 员 的 1) st Tiassa. Ste 人 
加 入 提升 了 原 得 到 SFT (supervised fine-tuning) 模型 下 降 ， 成 的 
始 训练 数据 的 (2) 使 用 SFT 模 型 生成 k 个 回答 并 对 其 质量 毒 内 容 更 少 的 
二 实 性 进行 人 工 排序 ， 训 练 奖励 模型 聊天 机 器 人 

AlGC (3) 基于 近 庙 策略 优化 (proximal policy 生成 式 

optimization, PPO) 模型 生成 回答 ， 并 预 训练 技术 
的 基础 技术 使 用 奖励 模型 对 其 进行 评估 和 打分 ， 进 而 更 sili 
(1) 大 规模 预 训练 模型 成 为 “ 疡 训 练 PPO 模 型 的 参 ent ri 
E + 


AlGC 的 发 展 趋势 


(2) 强化 学 习 的 思路 逐渐 应 用 
在 自然 语言 处 理 


2.1 ChatGPT 的 整体 技术 体系 
2.2AIGC 技术 基础 


内 容 生产 模式 经 历 了 专家 生产 内 容 (PGC) 、 用 户 生产 内 容 (UGC) ， 现 在 


基于 Transformer 的 生 
成 式 预 训练 技术 -GPT 


人 工 智 能 生成 (Artificial Intelligence Generate Content，AIGC) 成 为 了 必然 的 趋 
势 。 

AIGC 的 狭义 概念 是 利用 AI 自动 生成 内 容 的 生产 方式 “. 过 去 传统 的 人 工 智 
能 偏向 于 分 析 能 力 , 即 通过 分 析 一 组 数据 , 发 现 其 中 的 规律 和 模式 并 用 于 其 他 多 
种 用 途 , 比如 应 用 最 为 广泛 的 个 性 化 推荐 算法 。 而 现在 人 工 智能 正在 生成 新 的 东 
西 , 而 不 是 仅仅 局 限于 分 析 已 经 存在 的 东西 , 实现 了 人 工 智 能 从 感知 理解 世界 到 
生成 创造 世界 的 跃迁 。 

广义 的 AIGC 可 以 看 作 是 像 人 类 一 样 具 备 生 成 创造 能 力 的 AI 技术 , 即 生成 
式 AI， 它 可 以 基于 训练 数据 和 生成 算法 模型 ， 自 主 生成 创造 各 种 形式 的 内 容 和 
数据 ,例如 AI 写作 、AI 配 乐 、AI 视频 生成 、AI 语音 合成 、AI SES, APR 


需要 输入 几 个 关键 词 ， 模 型 在 几 秒 钟 之 内 就 能 自动 生成 内 容 。 
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2.2.1 AIGC 模型 简介 

AIGC 模型 是 通过 深度 神经 网 络 对 输入 内 容重 建 的 过 程 。 不 同 的 AIGC 模型 
有 不 同 的 学 习 方 式 。 

变 分 自 编码 器 (Variational Autoencoder, VAE) , FA encoder 与 decoder 组 成 ， 
encoder 负责 将 高 维 输入 转换 为 低 维 的 编码 ,decoder 负责 将 低 维 的 编码 转换 为 高 
维 的 输入 ， 使 输入 输出 尽量 相似 。 

生成 对 抗 网 络 (Generative Adversarial Networks，GAN) ，GAN 包含 一 个 生 
成 器 ,一 个 判别 器 ， 在 训练 生成 器 的 同时 ， 训 练 判别 器 来 判断 生成 器 生成 的 内 容 
是 否 真实 ， 通 过 生成 器 与 判别 器 的 相互 “ 博 弃 ”， 不 断 优化 生成 效果 。 

扩散 模型 (Diffusion Model) ， 扩 散 模 型 的 工作 原理 是 通过 添加 噪声 来 破坏 
训练 数据 ， 然 后 通过 逆转 添加 噪声 的 过 程 来 学 习 恢 复数 据 , 最 后 可 以 实现 从 潜在 
变量 到 内 容 生 成 。 

2.2.2 大 规模 预 训练 模型 成 为 AIGC 的 发 展 趋 势 

大 规模 语言 模型 (Large Language Model，LLM) 是 一 种 深度 学 习 算法 ， 可 
以 根据 从 海量 数据 集中 获得 的 知识 来 识别 、 汇 总 、 翻 译 、 预 测 和 生成 文本 和 其 他 
AS. LLM 通常 使 用 自 监 督学 习 方法 ， 从 TB 级 训练 文本 数据 中 发 现 隐 含 的 语 
言 规律 和 模式 ， 以 生成 符合 语法 和 语义 规则 的 新 文本 ， 往 往 具 有 上 亿 个 参数 ， 
此 对 计算 资源 的 性 能 有 较 高 要 求 。LLM 被 大 多 数 专家 认为 是 走向 AIGC 的 重要 


(1) ELMo 将 词 嵌 入 作为 新 特征 解决 一 词 多 义 问 题 
ELMo 是 基于 大 规模 无 监督 语 料 训练 的 一 个 双向 LSTM 语言 模型 。 它 由 两 


个 阶段 组 成 : 第 一 个 阶段 在 大 规模 语料库 上 利用 语言 模型 进行 预 训练 ; 第 二 个 阶 


多 是 在 做 下 游 任务 时 ,从 预 训练 网 络 中 提取 对 应 单词 的 各 层 网 络 词 吝 入 ,作为 新 
特征 融合 到 下 游 任务 中 。 因此 , ELMo 是 一 种 典型 的 基于 特征 融合 的 预 训 | 练 模型 。 

(2) BERT 通过 上 下 位 预 训练 提高 文本 理解 能 

BERT HJEMME Bidirectional Encoder Representations from Transformer, 也 就 
是 基于 Transformer 的 双向 编码 器 表征 。 顾名思义 , BERT 采用 的 是 Transformer, 
并 且 在 处 理 每 个 token 的 时 候 , 还 能 够 考虑 到 该 token 前 面 的 和 后 面 的 token, 得 
到 它 在 上 下 文中 的 含义 。BERT 在 训练 的 过 程 中 ， 采 用 掩 码 语言 模型 (Masked 
Language Modeling, MLM) ， 随 机 屏蔽 (mask) 部 分 输入 token， 然 后 训练 模型 
去 正确 预测 那些 被 屏蔽 的 token， 实 现 了 对 上 下 文 进行 特征 提取 的 目的 。 采 用 下 
一 句 预测 方法 (Next Sentence Prediction, NSP) ， 在 预 训练 过 程 , 句子 A 和 B 
作为 训练 样本 : B 在 50% 的 情况 下 是 A 的 下 一 句 ， 另 外 50% 的 情况 是 随机 从 语 
料 库 中 选取 任意 句子 ， 让 模型 判断 B 是 不 是 A 的 下 一 句 ， 从 而 提升 模型 的 上 下 
文理 解 能 力 。 
2.2.3 强化 学 习 的 思路 逐渐 应 用 在 自然 语言 处 理 任务 中 

强化 学 习 通 过 奖励 (Reward) 机 制 来 指导 模型 训练 ， 奖 励 机 制 可 以 看 做 传 
统 模型 训练 机 制 的 损失 函数 。 奖 励 的 计算 要 比 损失 函数 更 灵活 和 多 样 ， 如 
AlphaGO 的 奖励 是 对 局 的 胜 负 ， 这 带 来 的 代价 是 奖励 并 非 可 导 ， 因 此 不 能 直接 
拿 来 做 反 向 传播 。 强 化 学 习 的 思路 是 通过 对 奖励 的 大 量 采 样 来 拟 合 损失 函数 ， 从 

而 实现 模型 的 训练 。 如 应 用 强化 学 习 来 提高 信息 抽取 的 准确 率 “、 提 升 机 器 翻译 

效果 -、 提 升 文本 生成 能 力 ”。 


24 K. Narasimhan, A. Yala, and R. Barzilay. Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning. In Conference on Empirical 


Methods in Natural Language Processing (EMNLP), pages 5-2365, Austin, TX, USA, Nov. 2016. Association for Computational Linguistic 
25 C. Fugen, A. Waibel, and M. Kolss. Simultaneous Tran on of Lectures and Speeches. Machine Translation, 21(4):209-252, Dec. 2007 


26 Z. Li, X. Jiang, L. Shang, and H. Li. Paraphrase Gener: 
(EMNLP), pages 3865-3878, Brussels, Belgium, 2018. Ass 


n with Deep Reinforcement Learning. In Confer on Empirical Methods in Natural Language Processing 
tion for Computational Linguistics 


2.3ChatGPT 利用 人 类 知识 提升 了 原始 语 料 的 真实 性 

ChatGPT 的 训练 数据 来 源 包 括 两 个 方面 ， 一 是 GPT-1 至 GPT-3 的 基础 预 训 
练 数据 ， 二 是 人 工 标注 的 微调 数据 。 

国外 的 相关 学 者 Alan D. Thompson 对 GPT-1 到 GPT-3 的 基础 预 训练 数据 进 
行 了 统计 和 整理 ， 如 下 表 所 示 。 


表 2-1. GPT-n 的 基础 预 训练 数据 (单位 : GB) 2 


、 Common 本 
维基 百科 | 书籍 | 期 刊 | Reddit 链接 其 他 数据 集 
Crawl 
GPT-1 / 4.6 / / / / 
GPT-2 / / / 40 / / 
GPT-3 11.4 21 101 50 570 753 


在 人 工 标注 数据 方面 ，OpenAI 雇佣 了 40 名 标注 工 (labeler) ， 并 且 对 


labeler 进行 了 培训 ， 以 手工 写 文 本 的 方式 为 ChatGPT 提供 训练 语 料 ， 这 个 


数字 在 最 近 披露 的 报道 中 上 升 到 了 1000 名 左右 3#。ChatGPT 的 人 工 标注 的 语 料 


规模 与 其 同 级 模型 mstructGPT 类 似 ， 如 下 表 所 示 : 


表 2-2 InstructGPT 训练 数据 的 体 量 和 分 布 情况 (单位 : Token 数量 ) ” 


SFT Data RM Data PPO Data 
语 料 划分 BERRE BRAE | 语 料 划分 BAIR ” 语 料 数量 | 语 料 划分 BARKE ” 语 料 数量 
训练 集 标注 工 11,295 | 训练 集 标注 工 6,623 | 训练 集 用 户 31,144 
训练 集 用 户 1,430 | 训练 集 用 户 26,584 | 验证 集 用 户 16,185 
验证 集 标注 工 1,550 | 验证 集 标注 工 3,488 
验证 集 用 户 103 | 验证 集 用 户 14,399 


为 了 创建 一 个 安全 系统 ， 使 ChatGPT 分 辨 可 能 的 危险 言论 和 建议 ， 降 


27 Alan D. Thompson. What’s in my AI?[EB/OL]. [2021-02-17]. https://lifearchitect.ai/whats-in-my-ai/. 


28  https://www.reddit.com/r/MachineLearning/comments/ 1 Ogtruu/n_openai_used_kenyan_workers_on_less_than_2_per/ 


29 Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022. 
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低 回复 的 “毒性 "，OpenAI 向 肯尼亚 的 一 家 外 包公 司 发 送 了 数 以 万 计 的 文本 
片段 ， 并 要 求 工 人 为 内 容 贴 上 标签 。 这 些 内 容 似 乎 来 自 互 联网 最 黑暗 的 角 
落 。 其 中 一 些 以 图 形 形 式 详细 描述 了 谋杀 、 自 杀 、 酷 刑 、 自 残 和 乱伦 等 情 
况 。 标 注 工 人 每 9 小 时 阅读 和 标注 150 到 250 段 文字 ， 实 际 工资 却 为 每 小 
时 1.32 到 2 美元。 这 一 “ 非 人 性 化 ”的 标注 方式 也 受到 了 社会 各 界 的 指责 。 
2.4 利 用 生成 式 预 训练 技术 构建 ChatGPT 的 基础 模型 

2.4.1 生成 式 预 训练 模型 基础 一 Transformer 

Transformer 是 目前 常见 大 规模 语言 模型 的 核心 组 件 ， 其 最 早 应 用 于 跨 语种 
的 机 器 翻译 任务 中 , 它 将 源 语种 的 文字 进行 编码 ,而 后 按照 目标 语种 特征 进行 解 
码 来 完成 机 器 翻译 工作 。Transformer 是 由 Encoder (编码 器 ) 与 Decoder (解码 
器 ) 组 成 ， 采 用 了 自 注意 力 机 制 (Self-Attention) 利用 文本 的 已 观测 部 分 对 剩余 
未 观测 部 分 进行 预测 ， 从 而 学 习 文 本 中 的 上 下 文 特 征 。 目 前 常见 的 基于 
Transformer 的 预 训 练 语言 模型 有 BERT, GPT, BART 等 。 

2.4.2 生成 式 预 训练 模型 一 GPT 

GPT 是 一 种 基于 Transformer 的 预 训练 语 言 模型 2"。 它 通过 将 前 文 的 单词 序 
列 作为 输入 ， 预 测 下 一 个 单词 ， 从 而 训练 出 对 自然 语言 的 理解 能 力 ， 使 模型 更 适 
合生 成 式 的 自然 语言 处 理 任务 。 

GPT-3 模型 是 目前 最 新 的 预 训练 模型 ，WebGPT、GPT3.5、InstructGPT、 
ChatGPT 等 模型 均 是 在 GPT-3 模型 的 基础 上 微调 的 。GPT-3 模型 在 GPT-1 和 
GPT-2 的 基础 上 进行 了 改进 ， 具 有 更 大 的 模型 规模 ， 使 用 了 更 多 的 训练 数据 ,， 提 
高 了 模型 的 表示 能 力 和 泛 化 能 力 , 使 其 在 不 同 任务 上 的 表现 更 加 优秀 。 在 其 大 规 


30 Radford A, Narasimhan K, Salimans T, et al. Improving language understanding by generative pre-training[J]. 2018. 
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模 无 监督 预 训练 阶段 ，GPT-3 使 用 了 超过 10 万 亿 个 单词 级 别 的 文本 数据 ， 包 括 
维基 百科 、 网 页 、 书 籍 、 新 闻 文 章 等 ， 对 模型 进行 无 监督 预 训练 。GPT-3 采用 了 
自 回 归 的 方式 来 训练 模型 , 即 给 定 一 段 文本 序列 ， 模 型 将 逐个 预测 序列 中 下 一 个 
单词 的 概率 分 布 。 通 过 不 断 预测 文本 序列 的 下 一 个 单词 ,模型 可 以 学 习 到 单词 之 
间 的 关系 、 上 下 文 语义 、 语 法 规则 等 等 。 为 了 增加 模型 的 泛 化 能 力 ， 训 练 过 程 中 
还 使 用 了 随机 掩 码 和 无 标签 数据 的 技巧 以 及 多 任务 预 训 练 的 思想 。 
2.5 ChatGPT 是 GPT-3 Æ GPT-3.5 众多 模型 迭代 的 结果 
ChatGPT 模型 是 在 GPT-3.5 模型 基础 上 通过 利用 RHLF 微调 的 得 到 的 。 从 
GPT-3 到 GPT3.5 再 到 ChatGPT, 是 众多 模型 迭代 的 过 程 。 在 GPT-3 模型 的 基础 
上 ， 从 2020 初 年 至 2023 年 2 月 ，OpenAI 研发 了 超过 50 个 衍生 模型 ， 正 是 在 这 
些 模型 的 基础 上 ， 通 过 不 断 迭 代 更 新 ， 才 有 了 ChatGPT 模型 如 今 出 色 的 表现 。 
有 学 者 在 网 上 整理 了 GPT-3 的 系列 模型 ， 如 图 2.4 Pim. 


THE GPT-3 FAMILY: 50+ MODELS (FEB/2023) 


base (May/2020) embeddings (Jan/2022) instruct (old) insert + edit (Mar/2022) >> Miscellaneous API 
1. cushman:2020-05-03 
e GPT-3 Small 125M 。 textembedding-ade-002 @ —curie-instruct-beta 6.78 & text-davinci-insert-001 2. ada:2020-05-03 
© — GPT-3 Large 760M > text similarity InstructGPT-3 1758 (SFT) F ee = 
© GPT3278 davinci-instruct-beta @ text-davinci-insert-002 nee 
e pi . text-similarity-ada-001 text-odo-001 350M 5. davinci:2020-05-03 
GPT-3 138 。 a 
e text-similarity-babbage-001 i-edit 
Pe © textbabboge-001138 (FeedME) & Reticence en 
@ text-simiarity-curie-001 f 
@ text-curie-001 6.78 (FeedME) 了 
GPT-3 Medium 350M text-similority-davinci-001 le-davinci-edit- 
© ide text-davinci-001 1758 (FeedME) 
> text search 
PT- 
e pelts zee text-search-ada-doc-001 
@ amens = 2 wch-ada-query-O01 code (Jul/2021) GPT-3.5 (2022-2023) 
curie r n 
r = aTe Codex 128 © Codex 1758 (no instruct) 11.text-ada:001 
® GPT-3 1758 © text-search-babbage-query-001 cn code-davinci-002 12.text-babboge:001 
sail @ text-search-curie-doc-001 ia 13.text-curie:001 
@  textseorchcurie-query-001 vod- dind O08 © text-davinci-002 1758 人 
7 i FeedME 
special (Dec/2021) & os ( ) 15.audio-transcribe-deprecated 
3 1758 
webGPT oe eed secrete dd pier 00 pretrain + cpt (Mar/2022) @ ppp 
> code search 
GPT-3 1.38 pretrain Pi dar 
. code-search-ada-code-001 ° aaa e Total models shown in this viz 
ie © endeseorch-odo-text-O0t ip ae Microsoft Bing Chat 175B =a 
fel name / Parameters / Instruction type) 36. i 
API name [J Open via API @ code-search-babbage-code-001 ~ aoe oper ® (Proprietary, related to WebGPT) 
GPT-3 vised cpt-text 1.2B 
4 We ey © — code-search-babbage-text-001 ER 


@ LifeArchitect.ai/gpt-3 


2.4 GPT-3 系列 模型 31 


2.5.1 GPT-3 模型 的 四 个 版 本 


31 https://lifearchitect.ai/gpt-3/ 
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GPT-3 根据 其 模型 规模 大 小 , 分 为 四 个 版 本 , 分 别 为 Ada, Babbage, Curie, 
Davinci, 

Ada 为 参数 量 最 低 的 版 本 ， 适 用 于 小 型 任务 ， 如 解析 文本 、 简 单 分 类 、 地 址 
BE, KES. Ad 具有 最 快 的 响应 速度 与 最 少 的 计算 量 。 

Babbage 的 参数 量 高 于 Ada， 能 够 完成 简单 的 任务 ， 如 适度 分 类 、 语 义 搜索 
分 类 等 。 具 有 较 快 的 响应 速度 与 较 少 的 计算 量 。 

Curie 参数 量 高 于 Babbage， 响 应 速度 一 般 ， 计 算 量 较 大 ， 能 够 完成 语言 翻 


、 复 杂 分 类 、 情 感 分 类 、 文 本 摘要 等 任务 。 


r 


Davinci 是 GPT-3 中 规模 最 大 的 模型 ， 也 是 我 们 常 说 的 1750 亿 参 数量 的 版 


>t 


, OpenAl 发 布 的 诸多 大 模型 ， 如 InstructGPT, Codex 等 都 是 在 该 模型 基础 上 
微调 得 到 的 。Davinci 是 能 力 最 强 的 GPT-3 模型 ， 可 以 完成 其 他 型 号 模型 所 能 完 
成 的 任何 任务 ， 例 如 复杂 意图 、 因 果 关 系 、 特 定 受众 文本 摘要 等 ， 而 且 通 常 质量 
更 高 。 
2.5.2 用 于 文本 相关 性 计算 的 Embeddings 模型 

HRA (Embeddings) 模型 是 OpenAI API 之 一 ”2， 主 要 用 于 测量 文本 字符 串 
的 关联 性 ， 可 以 用 于 执行 搜索 、 聚 类 、 推 荐 、 分 类 等 任务 。 嵌 入 模型 本 质 上 是 一 
个 由 浮 点 数字 构成 的 向 量 , 文本 嵌入 之 间 的 关联 性 主要 通过 两 个 向 量 之 间 的 距离 
衡量 。 小 距离 表示 高 关联 度 ， 大 距离 表示 低 关 联 度 。 

OpenAl 发 布 了 三 个 系列 的 嵌入 模型 分别 侧 重 于 三 项 任务 : 文本 相似 性 度 
量 、 文 本 搜索 和 代码 搜索 。 这 些 模 型 将 文本 或 代码 作为 输入 ， 并 返回 一 个 向 量 。 
1) 文本 相似 性 模型 ”(Text Similarity) 


32 https://openai.com/blog/introducing-text-and-code-embeddings 


文本 相似 性 模型 提供 了 捕捉 文本 片段 的 语义 相似 性 的 嵌入 ,这些 模 型 对 许多 
任务 都 很 用 ,包括 聚 类 、 数 据 可 视 化 和 分 类 。 通 过 在 文本 嵌入 上 使 用 点 积 来 比 
较 两 段 文 本 的 相似 性 。 计 算 结果 以 "相似 度 分 数 " (余弦 相似 度 ) 来 表示 ， 介 于 
-1 和 1 之 间 ， 数 字 越 大 意味 着 相似 度 越 高 。 

2) 文本 搜索 模型 (Text Search) 

文本 搜索 模型 提供 了 能 够 实现 大 规模 搜索 任务 的 嵌入 , 如 在 给 定 的 文本 查询 
的 文件 集合 中 寻找 相关 的 文件 。 文 档 和 查询 的 嵌入 是 分 别 产生 的 ， 然 后 用 余弦 相 
似 度 来 比较 查询 和 每 个 文档 之 间 的 相似 度 。 基于 嵌入 的 搜索 可 以 较 好 地 捕捉 到 文 
本 的 语义 特征 ， 对 比 经 典 关键 词 搜索 中 使 用 的 单词 重 芭 技术 有 更 好 的 概括 性 。 

3) 代码 搜索 模型 (Code Search) 

代码 搜索 模型 为 代码 搜索 任务 提供 代码 和 文本 嵌入 。 给 定 一 个 代码 块 的 集合 ， 
任务 是 为 自然 语言 查询 找到 相关 的 代码 块 。 查看 代码 搜索 指南 , 使 用 嵌入 进行 代 
码 搜索 。 
2.5.3 用 于 代码 生成 的 Codex 模型 

Codex 是 GPT-3 系列 模型 之 一 ， 具 有 将 自然 语言 转换 为 计算 机 代码 的 功能 。 


Codex 研发 过 程 经 历 了 诸多 模型 的 迭代 , 从 GPT-3 开始 , 通过 代码 类 训练 语 料 的 


= 


学 习 ， 得 到 Code-davinci-001 模型 。 增 加 人 类 标注 数据 进行 有 监督 微调 ， 得 至 
Code-davinci-002 模型 ， 该 第 一 个 深度 融合 了 代码 训练 和 指令 微调 的 模型 ， 即 
Codex 模型 。 

Codex 的 训练 语 料 包 括 数 十 亿 行 公开 的 源 代 码 ， 例 如 Github 的 开源 代码 。 
在 训练 过 程 中 代码 功能 的 正确 性 评估 与 文本 生成 的 正确 性 评估 具有 区 别 , 传统 的 
BLEU score 评估 方式 不 再 试用 于 代码 正确 性 评估 ， 因 此 Codex 通过 优化 模型 模 


型 训练 过 程 中 的 评估 算法 与 人 工 标注 训练 集 的 方式 ， 提 升 GPT-3 的 代码 创作 能 
力 。 首 先 ， 它 优化 了 pass@k 算法 ， 用 于 评估 代码 功能 正确 性 ， 简 单 说 : 对 于 每 
个 编程 问题 ， 模 型 输出 n 个 代码 答案 ， 其 中 正确 的 代码 量 为 ce， 模 型 要 求 不 能 通 
过 代码 单元 测试 的 代码 量 (n-c) 必须 少 于 k。 同 时 OpenAI 还 构建 了 HumanEval 
datasef "， 增 加 人 类 智慧 ， 进 一 步 优化 模型 。Codex 精通 的 语言 包括 JavaScript. 
Go, Perl, PHP, Ruby, Swift 和 TypeScript， 其 中 最 精通 的 是 Python。 

ChatGPT 模型 的 代码 生成 功能 ， 即 是 在 Codex 模型 的 基础 上 ， 通 过 Instruct 
Turning, RLHF 等 方式 进一步 微调 的 结果 。 
2.5.4 用 于 文本 内 容 修改 的 Insert+Edit 模型 

以 往 GPT-3 在 对 内 容 进行 追加 的 时 候 ， 都 是 在 给 出 的 文本 或 代码 的 结尾 处 
增加 内 容 , Insert+Edit 模型 的 加 入 使 得 GPT-3 能 够 在 不 破坏 原 有 逻辑 的 情况 下 修 
改 原 有 的 文本 或 者 代码 、 以 及 将 大 段 内 容 插入 已 有 文本 或 代码 中 。 

具体 而 言 , 插入 功能 使 模型 能 够 在 已 有 的 文本 中 插入 上 下 文 相 关 的 文本 或 者 
代码 ， 因 此 可 以 保持 原文 本 以 及 代码 的 逻辑 一 致 性 。 这 个 功能 塑造 了 GPT-3 $ 
写 长 文本 、 实 现 段落 过 渡 、 代 码 编写 等 方面 的 功能 。 编 写 功能 可 以 将 输入 的 编写 
旧 令 作 为 “prompt” 和 “instruction” 来 修改 文本 的 表述 方式 和 结构 ， 或 者 进行 
针对 性 的 修改 〈 例 如 拼写 修改 、 语 法 修改 等 ) ; 对 于 代码 修改 ，GPT-3 可 以 完成 
不 同 代 码 语言 之 间 的 翻译 , 并 且 在 修改 代码 结构 、 改 变 代码 风格 方面 显示 出 了 突 
出 的 效果 。 

如 图 2.5 所 示 ， 插 入 的 功能 由 Text-davinci-insert-001 模型 和 


Text-davinci-insert-002 模型 提供 支撑 ; 修改 的 功能 由 Text-davinci-edit-001 和 


33 https://www.github.com/openai/human-eval 
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Code-davinci-edit-002 提供 支撑 。 


Text-davinci-insert-001 my InstructGPT 


Text-davinci-insert-002 


Code-davinci-002 Codex 模 型 


2.5 Insert+Edit 系列 模型 

2.5.5 GPT-3.5 系列 模型 

GPT3.5 是 一 系列 模型 的 统称 ，ChatGPT 即 是 在 GPT3.5 中 text-davinci-002 
模型 基础 上 ， 通 过 强化 学 习 微 调 得 到 的 。 如 下 表 所 示 ，Code-davinci-002 模型 是 
GPT-3.5 的 基础 模型 ， 适 用 于 纯 代码 补 全 任务 ，textrdavinci-002 模型 是 基于 
code-davinci-002 的 InstructGPT 模型 ，text-davinci-003 是 text-davinci-002 进一步 
通过 人 类 反馈 优化 后 的 模型 。Turbo 与 ChatGPT 属于 相同 的 模型 系列 。 它 针对 聊 
天 进行 了 优化 ， 因 此 可 用 于 对 话 式 聊 天 输入 和 输出 ， 但 在 完成 其 他 任务 时 和 
Davinci 模型 系列 一 样 表 现 出 色 。 


表 2-3 OpenAI 提供 的 GPT3.5 模型 API34 


模型 名 称 (API) 描述 最 大 token 数 时 间 


功能 最 强大 的 GPT-3.5 模型 ， 针 对 聊 
天 进行 了 优化 ; 成 本 仅 为 
gpt-3.5-turbo 4,096 tokens = #KIE 2021.9 
text-davinci-003 的 1/10; 将 使 用 最 新 
的 模型 迭代 进行 更 新 


gpt-3.5-turbo-0301 ”与 gpt-3.5-turbo 不 同 的 是 ， 这 个 模型 ” 4,096 tokens ÆRE 2021.9 


34 https://platform.openai.com/docs/models/gpt-3-5 
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将 不 会 得 到 更 新 
可 以 支持 任何 语言 任务 ， 且 比 curies 


text-davinci-003 ”babbage、ada 模型 输出 文本 质量 更 高 ， 4,000 tokens = 截止 2021.6 
长 度 更 长 ;还 支持 在 文本 中 插入 补 语 
与 text-davinci-003 的 能 力 相 似 ， 但 用 


text-davinci-002 4,000 tokens 截止 2021.6 
有 监督 微调 而 不 是 强化 学 习 进 行 训 练 
code-davinci-002 对 代码 补 全 任务 进行 了 优化 4,000 tokens ”截止 2021.6 


2.6 利 用 人 类 反馈 指导 (Instruct) ChatGPT 模型 微调 
2.6.1 基于 人 类 反馈 的 强化 学 习 RLHF 
ChatGPT 利用 RLHF (Reinforcement Learning from Human Feedback) 强化 算 
法 , 指导 模型 的 训练 过 程 。 强 化 学 习 通 过 奖励 (Reward) 机 制 来 指导 模型 训练 ， 
奖励 的 计算 要 比 损失 函数 更 灵活 和 多 样 . 强化 学 习 的 思路 是 通过 对 奖励 的 大 量 
样 来 拟 合 损失 函数 , 从 而 实现 模型 的 训练 .RLHF 最 早 可 以 追溯 到 Google 在 2017 
年 发 表 的 《Deep Reinforcement Learning from Human Preferences) * ， 它 通过 人 
工 标注 作为 反馈 ， 提 升 强化 学 习 的 表现 效果 。 
在 RLHF 的 框架 下 ，ChatGPT 的 训练 过 程 分 为 三 个 阶段 *: 第 一 阶段 ， 通 过 
人 工 标注 数据 微调 GPT-3.5 模型 得 到 SFT (Supervised Fine-Tuning) 模型 ; 第 二 
阶段 ,使 用 SFT 模型 生成 k 个 回答 并 对 其 质量 进行 人 工 排序 ， 训 练 奖励 模型 
(Reward Model) ; 第 三 阶段 , 基于 近 端 策略 优化 (Proximal Policy Optimization, 
PPO) 模型 生成 回答 ,并 使 用 奖励 模型 对 其 进行 评估 和 打分 ,进而 更 新 训练 PPO 
模型 的 参数 ， 直 至 模型 收敛。 如 图 2.2 所 示 (图 片 来 源 于 Opena 官方 网 站 ) 。 
分 别 对 每 一 阶段 的 工作 流程 进行 简要 概述 。 


35 论文 理解 【IL - IRL] ——Deep Reinforcement Learning from Human Preferences. https://blog.csdn.net/wxc971231/article/details/121785301 


36 Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J]. arXiv preprint arXiv:2203.02155, 2022. 
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Step 1 Step 2 Step 3 

Collect demonstration data Collect comparison data and Optimize a policy against the 

and train a supervised policy. train a reward model. reward model using the PPO 
reinforcement learning algorithm. 


A prompt is ` ri ta ` i 
p 23 Ap omp na Q A new prompt is Ar 
sampled from our 下 several model Et sampled from Writeastory 
prompt dataset. learning to a 6 year old. outputs are learning io ol the dataset. about otters. 
sampled. 


The PPO modelis 


A labeler O initialized from the LO + 
demonstrates the supervised policy. Ve 
desired output £ 
behavior. EEEE Y 
A labeler ranks the The policy generates Once upon atime... 
Y outputs from best an output. s 
SFT to worst. Y 
This data is used t BA, 
SS Geta SUSO O Kae | The reward model En 
ine- x N 7 oe 
ine tune GPT P WV | calculates a reward LEY 
WESHperyIse 2 M for the output. WA 
learning. BBB 
SEE This data is used LR 
to train our WRAY The reward is used ' 
reward model. to update the r 
0-0-0-0 policy using PPO. k 
037 
到 2.2 ChatGPT 的 训练 过 程 


(1) 微调 GPT-3.5 模型 得 到 SFT 

为 了 让 GPT-3.5 模型 初步 具备 理解 指令 中 蕴含 的 意图 , 首先 从 测试 用 户 提交 
的 prompt ( 即 指令 或 问题 ) 中 随机 抽取 一 批 数据 ， 依 靠 专 业 的 标注 人 员 对 抽取 
的 prompt 数据 进行 高 质量 回答 ， 获 得 <prompt, answer> 数 据 对 。 然 后 ， 使 用 这 些 
人 工 标注 好 的 数据 对 来 微调 GPT-3.5 模型 ， 从 而 使 模型 更 好 地 理解 输入 的 指令 。 


由 此 ， 一 个 基本 的 GPT-3.5 语言 模型 就 被 学 习 成 了 下 图 中 的 SFT 模型 


SRI, 


该 阶段 的 主要 目的 是 通过 


型 。 首 先 ， 随 机 
抽取 一 批 用 户 提交 的 prompt 数据 (大 部 分 和 第 一 阶段 抽取 的 相同 ) ， 使 用 第 一 


JIN, 东 奖 


阶段 生成 的 SFT 模型 ， 为 每 个 prompt 生成 k 个 不 同 的 回答 ， 于 是 模型 产生 了 
<prompt, answer1>, <prompt, answer2>...<prompt, answer k> 一 系列 的 数据 。 之 后 ， 


标注 人 员 按 照相 关 性 、 富 含 信息 性 、 有 害 信 息 等 诸多 标准 对 k 个 结果 的 质量 进 


37 https://openai.com/blog/chatgpt 
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综合 考虑 ， 得 出 它们 的 排名 顺序 ， 由 此 获得 了 奖励 模型 的 训练 数据 。 

接 下 来 ， 通 过 pair-wise learning to rank 模式 训练 奖励 模型 。 对 于 每 个 输入 
<prompt, answer>， 奖 励 模型 给 出 评价 其 回答 质量 高 低 的 奖励 分 数 。 具 体 来 看 ， 
对 于 一 对 训练 数据 <prompt，answerl> 和 <prompt answer2>, ， 假 设 人 工 排序 中 
answer | 排 在 answer2 前 面 ,那么 奖励 模型 损失 函数 鼓励 模型 对 <prompt, answerl> 
的 打分 比 <prompt， answer2> 高 。 最 终 对 于 训练 好 的 奖励 模型 来 说 ， 输 入 数据 对 


<prompt，answer>， 即 得 到 其 输出 结果 的 质量 得 分 ， 得 分 越 高 说 明生 成 的 回答 质 


(3) 基于 奖励 模型 的 输出 训练 生成 回答 

本 阶段 无 需 人 工 标注 数据 , 而 是 利用 上 一 阶段 训练 好 的 奖励 模型 ,对 结果 质 
量 进行 打分 来 更 新 预 训练 模型 参数 。 首 先 ， 从 用 户 提交 的 prompt 里 随机 抽取 一 
批 新 的 数据 ， 并 由 第 一 阶段 生成 的 SFT 模型 来 初始 化 近 端 策略 优化 PPO 模型 的 
参数 ， 这 里 新 的 数据 是 指 与 第 一 阶段 和 第 二 阶段 均 不 同 的 prompt， 这 样 做 的 目 
的 是 提升 LLM 理解 指令 的 泛 化 能 力 。 

然后 ， 对 于 随机 抽取 的 prompt， 使 用 PPO 模型 生成 对 应 的 回答 ， 进 而 使 用 
上 一 阶段 训练 好 的 奖励 模型 给 出 其 质量 评估 的 奖励 分 数 , 即 奖励 模型 赋予 整个 回 
答 (由 单词 序列 构成 ) 的 整体 奖励 。 接 下 来 ， 将 每 个 单词 看 作 一 个 时 间 步 ， 把 奖 
励 由 后 往 前 依次 传递 ， 由 此 产生 的 策略 梯度 可 以 更 新 PPO 模型 的 参数 。 这 是 标 
准 的 强化 学 习 过 程 ， 旨 在 训练 LLM 获得 高 奖励 的 答案 ， 也 即 产 生 符 合 奖励 模型 
标准 的 高 质量 回答 。 整 个 过 程 迭 代数 次 直至 模型 收敛 。 
2.6.2 RLHF 的 特点 与 优势 


总 的 来 说 ，RLHF 能 够 借助 人 类 给 予 的 反馈 ， 学 习 到 人 类 对 同一 Prompt 的 


所 有 类 型 回答 的 相对 偏好 ， 从 而 可 以 借助 RLHF 使 语言 模型 模仿 人 类 的 价值 观 ， 
保证 了 输出 的 一 致 性 ， 实 现 按照 人 类 价值 观 输出 回答 。 这 一 机 制 的 引入 使 得 
ChatGPT 具备 了 辨别 文本 好 坏 (Non-toxic) 的 能 力 , 满足 了 用 户 友 好 的 对 话 原 则 ， 
大 幅 提升 了 用 户 在 与 ChatGPT 对 话 过 程 中 的 体验 程度 。 而 BERT 是 相对 通用 的 
预 训练 模型 ， 其 在 问答 的 下 游 应 用 场景 中 ， 可 能 会 出 现 “ 口 无 遮 拦 "的 情况 ,回答 
并 不 能 很 好 地 满足 用 户 需 要 。 
2.7 利 用 奖励 模型 RM 使 ChatGPT 更 接近 人 类 表现 
2.7.1 奖励 模型 Reward Model 

模型 输入 : 问题 (Prompt) (x) . ILM 对 Prompt 的 输出 (Text) (y). 
标注 者 的 偏好 排序 (Rank) (yw > yz) 

模型 输出 : 对 根据 Prompt 生成 Text 的 参数 为 9 的 ILM 的 奖励 (Reward) 

(re (x, y)) 

模型 功能 : 学 习 人 类 对 Text 文本 的 偏好 ， 对 输入 的 每 一 条 Prompt-Text 对 在 
Sentence 层级 上 进行 评价 ， 提 供 该 Prompt-Text 对 的 人 类 偏好 奖励 

训练 Batch: 标注 者 对 同一 Prompt 生成 的 多 个 Text 的 排序 标注 (Rank) 

从 模型 结构 上 来 看 ，ChatGPT 中 的 原始 RM 模型 是 在 SFT 训练 后 的 GPT3.5 
基础 上 ， 移 除去 嵌入 层 (Unembedding Layer) 的 产物 。 在 原始 RM 模型 的 基础 
上 ， 首 先 基于 ELO 方法 ”* 将 标注 者 的 偏好 排序 转换 为 奖励 rg (x, y)， 转 换 的 公式 


如 下 : 


1 


Ea = Ty 10e-Ra)/400 
1 


Es = Ty 100a- Ra)/400 
Ra = Ra + A(S; — Ey) 


38 Elo A E. The rating of chessplayers, past and present[M]. Arco Pub., 1978. 


R = Rg + A(Sp — Ep) 
其 中 , 及 表示 调整 前 的 me(x, A), 54 表 示 A 的 期 望 得 分 (uptuw aran) ， 
$4 表示 A 的 实际 得 分 (实际 数据 集中 的 A>B 的 情况 ) ，R, 表 示 调 整 后 的 A 的 
1 (%, 4) ，2 为 调整 系数 。 
在 获得 标量 化 的 rg (x, IS, BEYER VUZE SUR, A Text 间 的 


损失 函数 ”计算 如 下 : 


Ez,yw)~D log (0 (ro (£, Yw) — ro (£, y1)))] 


加 

其 中 ,K 为 针对 同一 个 Prompt 所 生成 的 Text 数量 , 该 数 通常 位 于 4-9 Zi, 
D 为 整个 训练 数据 集 ，( 2 ) 表 示 排列 组 合 数 C2，yw 为 标注 者 更 偏好 的 Text, Text 
的 评价 是 按照 Sentence 粒度 的 Token 进行 的 ， 因 此 yw,y 均 可 视 作 是 多 个 Token 
的 聚合 ,也 即 % = Esi 
2.7.2 RM 的 特点 与 优势 

RM 解决 了 ChatGPT 这 一 超大 参数 规模 预 训练 模型 难以 微调 的 问题 。 由 于 
ChatGPT 采用 强化 学 习 的 方式 进行 调 参 , 对 其 训练 需要 构建 环境 来 对 LM 生成 的 
输出 进行 反馈 (Reward) ， 在 以 往 的 RL 过 程 中 ， 环 境 通 常 依赖 于 大 量 复杂 的 规 
则 来 构建 奖励 函数 ， 而 对 ChatGPT 来 说 ， 这 是 无 法 实现 的 。RM 能 够 对 输入 的 
Prompt- 输 出 对 进行 评价 ， 对 其 提供 标量 的 反馈 ， 起 到 了 RL 过 程 中 环境 的 功能 ， 
使 得 RLHF 得 以 进行 。 

此 外 ，RM 的 训练 数据 引入 了 人 工 标记 偏好 次 序 的 标注 方法 ， 避 开 了 直接 对 
Prompt- 输 出 对 文本 进行 评价 带 来 的 个 人 偏好 标注 偏差 、 标 注 者 专业 性 限制 导致 
的 标注 成 本 巨大 等 影响 调 优 效果 的 问题 。 
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2.8 利 用 PPO 模型 优化 ChatGPT 的 文本 生成 策略 
2.8.1 近 端 策略 优化 模型 PPO 

PPO (Proximal Policy Optimization) 算法 作为 ChatGPT 模型 训练 的 第 三 阶 
段 , 利用 第 二 阶段 训练 好 的 奖励 模型 ， 靠 奖励 打分 来 更 新 预 训练 模型 参数 。 在 数 
据 集中 随机 抽取 问题 ， 使 用 PPO 模型 生成 回答 ， 并 用 上 一 阶段 训练 好 的 奖励 模 
型 给 出 质量 分 数 。 把 回报 分 数 依次 传递 , 由 此 产生 策略 梯度 ， 通 过 强化 学 习 的 方 
式 以 更 新 PPO 模型 参数 4。 

PPO 算法 通过 与 环境 的 交互 来 交 蔡 采样 数据 ， 并 利用 随机 梯度 上 升 来 优化 
“替代 ”目标 函数 ”“。 标 准 的 策略 梯度 方法 对 每 个 数据 样本 进行 一 次 梯度 更 新 ， 这 
种 方法 若 想 实 现 良好 结果 具有 一 定 挑战 性 , 原因 是 算法 本 身 对 步 长 大 小 的 选择 很 
敏感 : 如 果 步 长 太 小 ,会 增加 处 理 数据 的 时 间 ， 导 致 计算 效率 低下 ; 如 果 步 长 太 
大 ， 有 效 的 信息 可 能 会 被 淹没 , 导致 计算 性 能 的 下 降 。 而 且 ,， 样本 的 效率 通常 比 
RÆ, 为 了 学 习 简 单 的 任务 ,往往 需要 花费 数 百 万 (或 数 十 亿 ) 的 时 间 。 相 比较 
策略 梯度 方法 , PPO 算法 的 优势 在 易于 实施 、 样 本 复杂 性 和 易于 调整 之 间 取 得 了 
平衡 ， 试 图 在 每 个 步骤 中 计算 更 新 ， 以 最 大 限度 地 降低 成 本 函数 ， 同 时 确保 与 之 
前 策略 的 偏差 相对 较 小 ”。 

除了 能 够 克服 策略 梯度 方法 存在 的 不 足 , PPO 算法 也 加 入 了 经 验 回放 , 即 在 
每 次 更 新 策略 参数 和 价值 参数 前 都 会 对 其 每 一 步 估 计 优势 和 价值 目标 , 并 存储 到 
经 验 库 中 , 从 经 验 库 中 多 次 抽取 一 批 经 验 进行 回放 和 学 习 用 于 更 新 策略 参数 和 价 
值 参 数 。 因 此 ， 经 验 回放 的 邻近 策略 优化 学 习 保 留 了 同 策 学 习 算 法 的 优势 “。 


40 https://blog.csdn.net/casclerightl/article/details/128914788 
41 Schulman J , Wolski F , Dhariwal P, et al. Proximal Policy Optimization Algorithms[J]. 2017. 
42 https://openai.com/blog/openai-baselines-ppo/ 


当 智 清 .强化 学 习 : 原理 与 实现 [M]. 机 械 工 业 出 版 社 , 2019:145-146 
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iv) 


ChatGPT 中 PPO 算法 流程 如 图 所 示 : 


持续 优化 参数 迭代 


2.3 近 端 策略 优化 模型 PPO 示意 图 

从 用 户 提交 的 指令 /问题 中 随机 抽取 一 批 新 的 命令 传 给 PPO 算法 ， 由 监督 学 
习 模 型 初始 化 PPO 算法 的 参数 并 生成 相应 回答 ， 将 该 回答 作为 输出 给 奖励 模型 
计算 质量 分 数 ， 每 一 次 得 到 的 分 数 再 将 依次 传递 ， 进 而 产生 策略 梯度 作为 PPO 
模型 参数 更 新 的 依据 ， 从 而 不 断 更 新 策略 。 
2.8.2 PPO 的 特点 与 优势 

PPO 是 一 种 同 策 调 优 方法 (On-Policy) ， 相 较 于 具备 马尔 可 夫 性 的 基于 价 
值 方法 (Value-Based Method) 或 异 策 调 优 方 法 (Off-Policy) , PPO 的 调 优 过 程 
中 使 用 的 经 验 是 当前 策略 产生 的 经 验 , 也 即 能 够 即时 对 当前 用 于 生成 输出 文本 的 
策略 进行 即时 优化 ,保证 了 估计 的 损失 函数 (RM 模型 的 输出 ) 与 当前 生成 策略 
的 一 致 性 , 从 而 使 得 生成 策略 会 随 着 对 话 的 进行 而 即时 改变 。 这 赋予 了 ChatGPT 
识别 前 后 段 对 话 的 能 力 ， 使 得 ChatGPT 在 与 用 户 的 对 话 中 具备 一 定 的 记忆 力 ， 
能 够 根据 先前 的 对 话 内 容 调整 下 一 次 输出 的 内 容 。 

此 外 , PPO 引入 了 经 验 回放 机 制 , 通过 随机 采样 将 用 于 训练 旧 策 略 的 轨迹 用 
于 新 策略 的 训练 , 提高 了 训练 所 用 数据 的 利用 率 , 还 限制 了 更 新 前 的 旧 策 略 与 更 
新 后 的 新 策略 的 变动 幅度 ,提高 了 算法 稳定 性 .在 ChatGPT 的 PPO 优化 过 程 中 ， 
还 同时 引入 了 KL 散 度 4 作为 惩罚 函数 ， 进 一 步 限制 了 单 代 优 化 过 程 中 的 新 旧 策 


44 Joyce J M. Kullback-leibler divergence[M]//International encyclopedia of statistical science. Springer, Berlin, Heidelberg, 2011: 720-722. 


略 差异 大 小 ， 提 高 了 ChatGPT 的 稳定 性 ， 避 免 了 ChatGPT 通过 非 正面 性 回答 问 


题 、 依 靠 投机 取 巧 取悦 人 类 来 收获 较 高 的 RM 评价 的 回答 方式 。 


3 ChatGPT 相关 研究 及 实践 

ChatGPT 的 出 现 引发 了 大 批 生成 式 大 规模 语言 模型 的 研究 热潮 , 国内 外 各 大 
科研 机 构 、 科 技 企业 等 都 将 ChatGPT 等 AI 技术 的 研究 视 为 推动 行业 范式 变革 的 
重要 战略 ， 纷 纷 投入 开展 对 其 研究 。 本 节 整 理 了 国内 外 的 相关 研究 ， 旨 在 了 解 业 
界 机 构 的 最 新 研究 动态 ， 跟 踪 其 最 前 沿 研究 成 果 。 

3.1 谷 歌 

2 月 7 日 , 谷歌 CEO Sundar Pichai 发 布 了 自家 的 AI 对 话 式 机 器 人 Bard ( 吟 
游 诗人 ) o Bard 是 由 LaMDA 提供 支持 的 全 新 实验 性 对 话 Google AI 服务 “， 寻 
求 将 世界 知识 的 广度 与 谷歌 大 型 语言 模型 的 力量 、 智 慧 和 创造 力 相 结合 。 它 利用 
来 自 网 络 的 信息 提供 最 新 高 质量 的 回复 .Google 于 2021 年 推出 LaMDA 模型 ， 
2022 年 初 发 表 的 论文 指出 该 模型 用 上 1,370 亿 组 参数 来 进行 训练 , 能 够 实现 接近 
真人 的 对 话 体验 “。 

同 为 聊天 机 器 人 ， 谷 歌 的 Bard 与 微软 支持 的 ChatGPT 具有 相似 之 处 ， 它 们 
需要 用 户 键入 一 个 问题 或 请 求 ， 并 对 此 做 出 作出 回应 。Bard 与 ChatGPT 的 最 大 
不 同 在 于 ChatGPT 的 最 新 数据 仅 截至 2021 Æ, M Bard 可 以 回答 当下 的 问题 ， 
达到 即时 搜索 回答 的 效果 。 据悉 ,ChatGPT 收集 的 内 容 截止 到 2021 年 ”。 目前， 
Bard 采用 轻 量 版 LaMDA， 算 力 要 求 较 低 ， 故 此 能 开放 给 更 多 人 使 用 ， 以 获得 更 
多 用 户 回 馈 ， 帮 助 AI 持续 学 习 和 改善 表现 ”。 


45 https://baijiahao.baidu.com/s?id=1757162663457326343 

46 https://blog.google/technology/ai/bard-google-ai-search-updates/ 

47 https://m.sohu.com/coo/heisha/638592445_121647777 

48 http://column.etnetchina.com.cn/column-list-EtnetcolB377/103890.htm 


3.2 百 度 

百度 研发 的 文 心 一 言 (ERNIE Bot) 将 于 3 月 份 完 成 内 测 , 并 面向 公众 开放 ， 
最 初版 本 将 嵌入 其 搜索 服务 中 。 百 度 官 宣 这 一 消息 的 微 信 公众 号 文章 , 责任 编辑 
一 栏 团 名 为 “ 希 加 加 、 度 晓 晓 、， 叶 悠 您 、 林 开 开 ”一 一 这 四 个 正 是 百度 现 有 的 数字 
人 ， 从 某 种 意义 上 说 ， 这 也 是 百度 展现 其 AI 模型 的 实力 。 

文 心 一 言 是 一 款 基于 知识 增强 的 持续 学 习 语 义理 解 框架 的 AI， 该 框架 将 大 
数据 预 训练 与 多 源 丰 富 知识 相 结合 ， 通 过 持续 学 习 技 术 ， 吸 收文 本 数据 中 词汇 、 
结构 、 语 义 等 方面 的 知识 ， 从 而 令 模 型 效果 不 断 优化 。 百 度 在 人 工 智能 领域 深耕 
十 余年 ， 拥 有 产业 级 知识 增强 文 心 大 模型 ERNE ， 具 备 跨 模 态 、 跨 语言 的 深度 
语义 理解 与 生成 能 力 *。 百 度 在 人 工 智 能 四 层 架 构 中 有 全 栈 布局 ， 包 括 底层 的 心 
片 、 深 度 学 习 框架 、 大 模型 以 及 最 上 层 的 搜索 等 应 用 。 有 消息 表明 ， 文 心 一 言 已 
经 逐渐 发 展 到 能 够 完成 语言 理解 、 语 言 生成 和 文本 生成 图 像 等 任务 , 百度 的 目标 
是 将 该 服务 作为 一 个 独立 的 应 用 来 使 用 , 并 在 用 户 进行 搜索 时 通过 纳入 聊天 机 器 
人 生成 的 结果 逐渐 融入 其 搜索 引擎 ”。 

3.3 阿 里 

阿里 巴巴 达 摩 院 先后 发 布 多 个 版 本 的 多 模 态 及 语言 大 模型 ,在 超大 模型 、 低 
碳 训 练 技 术 、 平 台 化 服务 、 落 地 应 用 等 方面 实现 突破 , 引领 了 中 文大 模型 的 发 展 。 
据 阿里 研究 院 公 布 的 信息 显示 ， 阿 里 巴巴 达 摩 院 在 2020 年 初 启动 中 文 多 模仿 预 
训练 模型 M6 项 目 ， 同 年 6 月 推出 3 亿 参 数 的 基础 模型 ; 2020 年 10 月 ，M6 的 
参数 规模 扩展 到 10 万 亿 , 成 为 当时 全 球 最 大 的 AI 预 训 练 模型 ,阿里 云 曾 表示 ， 
作为 国内 首 个 商业 化 落地 的 多 模 态 大 模型 ，M6 已 在 超 40 个 场景 中 应 用 ， 日 调 


49 BSB: 文 心 一 言 : https://mp.weixin.qq.com/s/0-8X9FPouteKzNiK6DPaiA 


50 百度 官 宣 “ 文 心 一 言 ” : 中 国 版 ChatGPT 下 月 面世 : https://www.cankaoxiaoxi.com/science/20230208/2504081.shtml 


用 量 上 亿 。 在 阿里 云 内 部 ，M56 大 模型 的 应 用 包括 但 不 限于 在 犀牛 智 造 为 品牌 设 
计 的 服饰 已 在 淘宝 上 线 、 为 天 猫 虚拟 主播 创作 剧本 ， 以 及 增进 淘宝 、 支 付 宝 等 平 
台 的 搜索 及 内 容 认 知 精度 等 ， 尤 其 擅长 设计 、 写 作 、 问 答 ， 在 电 商 、 制 造 业 、 文 
学 艺术 、 科 学 研究 等 前 景 中 落地 。 

2 月 7 日 ， 钉 钉 公 众 号 称 ， 其 App 可 以 在 钉 钉 机 器 人 里 接 入 类 似 ChatGPT 
的 功能 ， 实 现 机 器 人 对 话 相关 操作 。 气 报道， 阿里 达 摩 院 正在 研发 类 ChatGPT 
的 对 话机 器 人 ， 目 前 已 开放 给 公司 内 部 员工 测试 :。 从 曝光 截图 来 看 ， 阿 里 巴巴 
可 能 将 AI 大 模型 技术 与 钉 钉 生产 力 工 具 深度 结合 ， 该 模型 不 仅 有 纯 文本 任务 能 
力 ， 还 融合 了 多 模 态 任务 能 力 。 
3.4 腾 讯 

腾讯 的 智能 AIGC 产品 文 涌 (Effidit) 整合 了 知识 抽取 、 文 本 理解 、 文 本 生 
成 、 预 训练 模型 、 经 典 语言 模型 和 搜索 等 技术 ， 已 落地 于 腾讯 广告 、 搜 索 、 对 话 
等 内 部 产品 ， 使 用 混 元 系列 AI 大 模型 作为 底层 预 训练 模型 ?。 

2022 年 11 H, HunYuan 借助 腾讯 太极 机 器 学 习 平台 , 推出 HunYuan-NLP 1T 


> 


模型 , ST CLUE 自然 语言 理解 任务 榜 单 。 该 模型 在 热 启动 、MoE 路 由 算法 、 
模型 结构 和 训 | 练 加 速 方 面 进行 了 优化 ,降低 了 训练 成 本 , 最 快 仅 用 256 卡 在 一 天 
内 完成 训练 ， 整 体 训练 成 本 仅 为 1/8”。 

3.5 京 东 

基于 产业 需求 ， 京 东 云 旗下 言 犀 人 工 智能 应 用 平台 将 推出 ChaJD， 定 位 为 


产业 版 ChatGPT， 虽 在 打造 优势 、 高 频 、 刚 需 的 产业 版 通用 ChatGPT™, RRA 


51 阿里 类 ChatGPT 产品 曝光 ， 已 进入 内 测 阶段 : https://k.sina.com.cn/article_6192937794_17120bb4202001zmw7.html 
52 https://mp.weixin.qq.com/s/TG2vITOUr XSdGgNOILnSw 
53 https://m.thepaper.cn/baijiahao_20908780 


54 京东 云 言 犀 将 推出 产业 版 ChatGPT: ChatJD 并 公布 落地 应 用 “125? 计 划 : https://www.chinanews.com/cj/2023/02-10/995 1350.shtml 
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在 AIGC&ChatGPT 的 布局 ， 主 要 聚焦 文本 、 声 音 、 对 话 生成 、 数 字 人 生成 和 通 
用 型 Chat AI 技术 五 个 方面 : 文本 生成 (NLG) 包括 商品 标题 (10 个 字 ) 、 商 
品 卖点 文案 (100 字 ) 、 商 品 直播 文案 (500 字 ) 三 类 ， 聚 焦 商品 文案 生成 。 目 
前 商品 文案 写作 能 力 已 经 覆盖 2000 多 个 京东 的 品类 ， 京 东 的 商品 文案 生成 技术 
已 累计 生成 文案 30 多 亿 字 。 语 音 生成 (TTS) 语音 合成 主要 应 用 到 智能 客服 、 
SaaS 外 呼 、 金 融 、AI 直播 等 产品 。 
3.64} AI 6 

科大 讯 飞 于 2 月 8 日 表示 , “ChatGPT 主要 涉及 到 自然 语言 处 理 相关 技术 ， 
属于 认 知 智能 领域 的 应 用 之 一 ， 公 司 在 该 方向 技术 和 应 用 具备 深厚 积累 ”%。 据 
介绍 , ENAR KESH A RA, 产业 场景 、 行 业 数 据 等 基础 上 , 公司 已 于 2022 
年 12 月 份 进一步 启动 生成 式 预 训练 大 模型 任务 攻关 ,科大 讯 飞 AI 学 习 机 将 成 为 
该 项 技术 率先 落地 的 产品 ， 并 于 2023 年 5 月 6 日 进行 产品 级 发 布 。 该 技术 突破 
将 在 AI 学 习 机 的 中 英文 作文 辅导 、 中 英文 口语 学 习 等 方面 带 来 显著 提升 5 

科大 讯 飞 于 2022 年 获得 CommonsenseQA2.0、OpenBookQA 等 多 个 认 知 智 
能 领域 权威 评测 的 第 一 ”在 文本 识别 、 语 音 识别 、 语 义理 解 等 领域 优势 明显 ?。 
已 面向 认 知 智能 领域 陆续 开源 了 6 大 类 、 超 过 40 个 通用 领域 的 系列 中 文 预 训练 
语言 模型 ， 成 为 业界 最 广泛 流行 的 中 文 预 训练 模型 之 一 。 
3.7 华 为 

华为 MindSpore 团队 和 鹏 城 实验 室 在 2021 年 联合 发 布 了 全 球 首 个 干 亿 参数 
的 预 训 练 中 文 模型 鹏 程 .盘古 ， 模 型 参数 为 两 干 亿 ; 另 一 个 是 华为 云 联 合 鹏 城 实 


55 https://www.xfyun.cn/?ch=xfow 
56 https://baijiahao.baidu.com/s?id=1757360843908924072 


57 全 面 解读 ChatGPT 产业 链 机 会 : https://new.qq.com/rain/a/20230201A08RYI00 


58 科大 讯 飞 有 ChatGPT 相关 技术 积累 并 保持 核心 技术 处 于 世界 前 沿 水 平 : https://www.9fzt.com/detail/sz_399685_1_123508192595365.html 
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验 室 一 起 联合 训练 出 来 的 华为 .盘古 大 模型 ， 这 个 模型 参数 为 1100 亿 ,， 均 专门 是 
针对 中 文 的 。 基 于 这 些 模 型 可 以 做 云 搜索 ,智能 客服 ， 医 疗 向 导 ， 互 动 教育 、 文 
学 创作 、 自 动 摘要 的 生成 等 。 这 个 模型 将 突破 语言 壁 爹 ， 支 撑 国 家 战略 ， 将 与 鹏 
城 实 验 室 在 多 个 场景 进行 持续 探索 与 创新 。 
3.8 奇 虎 360 

公司 的 人 工 智能 研究 院 从 2020 年 开始 一 直 在 包括 类 ChatGPT 技术 在 内 的 
AIGC 技术 上 有 持续 性 的 投入 ， 但 截至 目前 仪 作为 内 部 业务 自用 的 生产 力 工 具 使 
用 。 公 司 计划 尽快 推出 类 ChatGPT 技术 的 DEMO 版 产品 。AIGC 技术 除了 在 搜 
索引 掌 的 应 用 之 外 ， 还 可 以 辅助 数字 安全 能 力 的 提升 ”。 
3.9 北 京 智 源 研究 院 

通过 搭建 多 语言 文 图 表征 模型 AltCLIP, 智 源 研究 院 的 研究 者 先 推出 了 中 英 
双语 图 像 生成 模型 AltDiffusion， 支 持 精 细 长 中 文 Prompts 高 级 创作 。 在 此 基础 
上 ， 还 推出 了 多 语言 升级 版 AltDiffusion-m9， 其 成 为 首 个 支持 9 种 语言 的 文 图 
生成 模型 。 该 研究 的 主要 贡献 是 搭建 了 一 个 多 语言 文 图 生成 模型 的 基石 ， 使 得 
多 使 用 不 同 语言 的 创作 者 可 以 通过 AltDiffusion 模型 进行 创作 %。 
3.10 IDEA 研究 院 

2021 年 11 月 22 A, IDEA 研究 院 创 院 理事 长 沈 向 洋 在 IDEA 大 会 上 正式 宣 


布 启 动 “封神榜 ”大 模型 开源 计划 ”该 中 心 拥 有 国内 最 大 的 开源 模型 体系 一 一 封 
神 榜 ， 已 开源 的 98 个 模型 如 (1) 二郎神 系列 : 以 Encoder 结构 为 主 的 双向 语言 
系列 模型 ， 专 注 于 解决 各 种 自然 语言 理解 任务 。 (2) 余 元 系列 : 本 系列 模型 主 


要 面向 医疗 领域 。 (3) 周文 王 系列 : 是 IDEA 研究 院 与 人 奶 一 科技 联合 开发 的 一 


59 https://baijiahao.baidu.com/s?id=1757 150426025501183 
60 https://baijiahao. baidu.com/s?id=17566840794598 11648 


61 https://www.idea.edu.cn/fengshenbang-Im.html 


系列 新 结构 大 模型 , 是 中 文 领域 内 可 同时 做 LM 和 MLM 任务 的 最 大 模型 。 (4) 
闻 仲 系列 :以 Decoder 结构 为 主 的 单 向 语言 模型 ,是 一 系列 强大 的 生成 模型 。(5) 
燃 灯 系列 : 本 系列 是 以 Transformer 结构 为 主 的 编 解码 语言 模型 ， 主 要 解决 通用 
任务 。 (6) 比 干 系列 : 本 系列 主要 面向 各 种 纠 错 任务 。 开 源 模型 探索 研发 适 配 
各 个 领域 的 个 性 化 可 定制 模型 ， 支 持 全 部 自然 语言 处 理 任 务 ， 推 出 类 ChatGPT 
模型 ， 全 力 支持 中 国 AIGC WAR. 
3.11 中 科 院 自动 化 所 

中 国 科学 院 自动 化 研究 所 和 华为 等 联合 开发 的 全 球 首 个 三 模 态 大 模型 “ 紫 东 
太初 "“。 该 平台 通过 跨 模 态 多 任务 自 监督 学 习 实现 图 像 、 文 本 、 语 音 三 模 态 数据 
间 的 “统一 表示 "与 “相互 生成 "， 并 基于 国产 化 自主 AI 基础 软 硬 件 平台 〈 异 腾 ) 
开发 实现 ， 向 更 加 通用 型 人 工 智能 跨 出 一 步 。 在 上 海 开幕 的 2022 世界 人 工 智能 
大 会 上 ， 该 模型 的 研究 团队 获得 了 大 会 最 高 奖项 “卓越 人 工 智能 引领 者 "(SAIL， 
Superior AI Leader)22, 
3.12 鹏 程 实验 室 

鹏 程 实 验 室 (深圳 网 络 空间 科学 与 技术 省 实验 室 ) 联合 华为 在 2021 年 发 布 
了 盘古 大 模型 ， 是 国产 全 栈 式 AI 基础 设施 第 一 次 支持 2000 亿 级 超大 规模 语言 
模型 训练 ， 探 索 并 验证 了 国产 E 级 智 算 平 台 在 软 硬 件 协同 优化 、 大 规模 分 布 式 
并 行 训 | 练 等 核心 关键 技术 上 的 可 行 性 *%。 鹏 程 实验 室 在 2022 年 发 布 的 生物 信息 
研究 平台 鹏 程 -神农 是 面向 生物 医学 领域 的 人 工 智 能 平台 ， 用 于 加 速 新 型 药物 的 


62 “ 紫 东 太初 ”多 模 态 大 模型 获 世界 人 工 智能 大 会 最 高 奖 : https://www.cas.cn/cm/202209/t20220902 4846612.shtml 


63 中 国 算 力 网 的 机 遇 与 挑战 : https://pcl.ac.cn/html/943/2023-01-28/content-4189.html 


64 高 密度 ARM 服务 器 如 何 引领 ' 数 智 时 代 ”" 发 展 ， 打 通 ' 智 变质 变 " 正 循环 : https://developer.huawei.com/consumer/cn/forum/topic/0203110741145865182 
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筛选 与 创制 $。 
3.13 其 他 

除了 上 述 企业 及 机 构 之 外 ,发 布 过 的 大 规模 语言 模型 还 有 很 多 , 比如 Meta AI 
的 OPT-IML、Hugging Face 的 Bloom 等 等 。 在 对 话 技术 方面 ， 近 年 来 也 有 多 家 
企业 发 布 过 自己 的 聊天 机 器 人 ， 比 如 Meta 的 BlenderBot、 谷 歌 的 LaMDA、 
DeepMind 的 Sparrow 等 等 "。ChatGPT 作为 其 中 的 佼佼 者 ， 再 次 点 燃 了 对 话 生 
成 技术 的 热潮 ,并且 通 过 与 搜索 引擎 的 结合 ， 开 始 显现 出 更 大 的 应 用 价值 。 更 多 
企业 和 机 构 势 必 跟 进 相关 AI 技术 的 研发 ， 内 容 创 作 、 智 能 客服 等 多 个 领域 将 从 


ik 


E 


中 受益 ， 


4 ChatGPT 的 应 用 


作为 AIGC 技术 的 具体 应 用 , ChatGPT 的 出 现 为 各 个 行业 验证 了 一 种 新 的 可 
能 。 全球 各 个 行业 领域 都 在 分 析 研究 如 何 将 其 引入 自身 行业 体系 中 ,从 而 进一步 
抢占 市 场 先 机 。 已 有 多 家 企业 积极 布局 和 研发 ChatGPT 相关 的 产品 和 服务 。 我 
们 认为 它 将 可 能 在 以 下 领域 发 挥 多 样 化 的 潜力 。 
4.1ChatGPT 在 科研 领域 的 应 用 

基于 Transformer 模型 结构 改造 的 AlphaFold 及 AlphaFold2 在 生物 化 学 领域 
取得 了 巨大 的 成 功 , 是 人 工 智能 技术 在 科研 领域 举世 瞩目 的 重要 进展 。 生 物化 学 
领域 的 科研 机 构 和 企业 从 ChatGPT 发 布 开始 ， 就 在 迅速 跟 进 相关 动态 ， 并 尝试 
借 此 提升 科研 过 程 的 效率 。 另 外 ,在 论文 等 科研 成 果 的 编写 方面 ，ChatGPT 也 初 


65 人 工 智能 产业 的 科研 创新 : https:/mews.fange59.com/jjsy/24626.html 
66 https://baijiahao.baidu.com/s?id=1756200507168401095 


4.1.1 ChatGPT 用 于 生物 化 学 研究 
(1) 药物 发 现 

阿 斯 利康 在 将 ChatGPT 应 用 于 药物 发 现 的 一 项 研究 中 表示 ，ChatGPT 可 以 
识别 出 传统 方法 未 发 现 的 新 半点 ， 并 展示 了 生成 式 AI 算法 在 加 速 药物 发 现 过 程 
的 潜力 。 剑 桥 大 学 的 研究 人 员 利 用 ChatGPT 分 析 科 学 文献 并 确定 了 一 个 治疗 阿 
Seas eo; 旧金山 加 利 福 尼 亚 大 学 的 研究 人 员 使 用 ChatGPT 分 析 电 
子 健康 记录 并 识别 现实 环境 中 存在 的 潜在 药物 间 相 互 作用 关系 。 Insilico Medicine 
创始 人 兼 联合 首席 执行 官 Alex Zhavoronkov 表示 ， 生 成 式 AI 可 根据 条 件 来 合成 
数据 ， 目 前 已 被 应 用 于 医疗 健康 领域 的 方方面面 ， 但 是 考虑 到 ChatGPT 使 用 的 
训练 集 和 训练 它 的 AI 训练 师 水 平 ， 存 在 准确 性 问题 ， 所 以 暂时 不 建议 将 其 直接 
应 用 于 任何 生物 医学 领域 ”7。 

(2) 预测 分 子 结构 

在 ChatGPT 发 布 之 前 ,已 经 有 一 些 研究 在 探索 GPT-3 等 通用 生成 式 大 模型 
在 科研 领域 应 用 的 可 行 性 。 研究 “探讨 了 GPT-3 模型 在 化 学 领域 的 低 数 据 发 现 能 
力 。 作 者 发 现 GPT-3 模型 虽然 可 以 生成 一 些 看 起 来 合理 的 分 子 结构 ， 但 是 在 预 
测 这 些 结构 的 性 质 和 稳定 性 时 表现 不 佳 。 与 此 同时 ， 作 者 还 发 现 GPT-3 模型 在 
化 学 领域 中 存在 语言 不 连贯 性 和 化 学 符号 解析 问题 等 局 限 性 。 综 上 ,ChatGPT 等 
生成 式 模型 在 生物 化 学 领域 虽然 存在 潜力 ， 但 目前 仍 没有 产生 类 似 于 AlphaFold 
等 专用 模型 的 有 效 成 果 。 
4.1.2 ChatGPT 用 于 科研 写作 


67 https://baijiahao. baidu.com/s?id=1758039 163135704089 
68 Is GPT-3 all you need for low-data discovery in chemistry? https://chemrxiv.org/engage/chemrxiv/article-details/63eb5a669da0bc6b33e97a35 


ChatGPT 从 去 年 12 月 推出 以 来 ,已 经 有 不 少 人 将 它 用 作 论 文 写作 的 工具 %”。 
据 Nature 统计 ,使 用 ChatGPT 并 将 其 列 为 作者 的 论文 最 少 有 4 篇 。AI 药物 研发 
公司 Insilico Medicine 的 CEO, Alex Zhavoronkov 透露 道 ， 其 所 在 的 机 构 已 发 表 
了 80 多 篇 由 AI 工具 生成 的 论文 "。Nature、Science 多 个 顶级 刊物 纷纷 开始 对 
ChatGPT 出 台 使 用 限制 措施 。Springer Nature 发 布 了 其 在 科学 论文 中 使 用 人 工 智 
能 写作 工具 的 政策 ， 像 ChatGPT 这 样 的 软件 在 其 数 干 种 期 刊 上 发 表 的 论文 中 不 
能 被 记 为 作者 身份 "。 斯 普 林 格 公司 表示 ， 它 对 科学 家 使 用 人 工 智能 帮助 写作 或 
产生 研究 想法 没有 异议 ， 但 需要 作者 来 适当 披露 这 种 贡献 。 
4.2ChatGPT 在 教育 领域 的 应 用 

ChatGPT 人 工 智 能 语言 模型 应 用 的 开发 开辟 了 新 的 学 习 机 会 , 它 能 够 提供 随 
时 随地 访问 的 个 性 化 学 习 体验 ， 是 一 种 经 济 高 效 的 教育 解决 方案 。 
4.2.1 ChatGPT 用 于 教学 

在 美国 ， 有 老师 让 学 生 和 ChatGPT 辩论 ， 以 训练 批判 性 思维 ， 还 有 老师 试 
用 ChatGPT 出 题 ， 提 高 备课 效率 ， 还 有 老师 用 其 快速 搜索 资料 ， 提 高 课程 丰富 
度 。 国 内 类 ChatGPT 技术 也 于 教育 领域 落地 。 


2 月 8 日 ,小 度 推出 旗下 首 款 搭载 ChatGPT 同 源 技术 的 教育 硬件 产品 一 一 小 
度 光 学 护 眼 学 习 平 板 ， 用 户 在 该 产品 上 已 经 可 以 体验 作文 批改 和 主动 润色 等 Al 
功能 .网 易 有 道 方面 透露 , 有 道 AI 技术 团队 已 投入 到 ChatGPT 同 源 技术 (AIGC) 

在 教育 场景 的 落地 研发 中 ， 目 前 该 团队 已 在 AI 口语 老师 、 中 文 作 文 批改 等 细 分 
学 习 场 景 中 尝试 上 应用。 同时， 公司 有 望 尽快 推出 相关 的 demo 版 产品 ,该 产品 的 
面世 将 标志 着 AGC 技术 在 国内 互联 网 教育 场景 的 首次 着 陆 。 科 大 讯 《于 2022 


69 https://baijiahao.baidu.com/s?id=1757239547336214156 
70 https://baijiahao.baidu.com/s?id=1756245018319071719 
71 https://www.theverge.com/2023/1/26/23570967/ChatGPT-author-scientific-papers-springer-nature-ban 


年 12 月 份 进一步 启动 生成 式 预 训练 大 模型 任务 攻关 ,科大 讯 飞 Al 学 习 机 将 成 为 
该 项 技术 率先 落地 的 产品 ， 并 于 2023 年 5 月 6 日 进行 产品 级 发 布 。 

但 是 ， 有 学 生 已 经 把 ChatGPT 当成 作 炊 工具 。 截 至 2023 年 1 月 , 美国 89% 
的 大 学 生 利用 ChatGPT 应 付 作业 。 全 球 多 个 学 校 已 经 禁用 ChatGPT， 理 由 是 担 
心 学 生 利用 ChatGPT 作弊 ， 沦 为 ChatGPT 喂养 的 "宠物 "， 表 失学 习 能 力 以 及 批 
判 思 维 。ChatGPT 的 孵化 机 构 OpenAI 公司 发 言 人 担心 学 生 沉迷 于 ' 拿 来 主义 ”， 
透露 正在 开发 反 作 疾 系统 ， 检 测 AI 自动 生成 文本 。 斯 坦 福 研究 人 员 推 出 了 
DetectGPT”， 便 于 检测 出 AI 生成 文本 。 
4.2.2 ChatGPT 用 于 考试 

另外 , 有 多 项 研究 在 探讨 ChatGPT 在 课程 考试 中 的 可 行 性 。 研 究 ” 以 物理 学 
课程 的 考核 内 容 为 对 象 ， 实 验 表明 ChatGPT 可 以 勉强 通过 这 门 课程 ， 但 是 
现 出 像 是 初学 者 犯 的 错误 。 研究 "将 ChatGPT 用 于 明尼苏达 大 学 的 四 次 法 学 真实 
考试 中 ，ChatGPT 均 取 得 了 较 低 但 合格 的 成 绩 。 研 究 “将 ChatGPT 应 用 于 美国 
医疗 许可 考试 (USMLE) 中 ，ChatGPT 通过 了 考试 ， 并 表现 出 能 够 执行 与 处 理 
复杂 的 医疗 和 临床 信息 的 能 力 。 但 是 ,研究 "对 ChatGPT 进行 了 软件 测试 课程 的 
考试 实验 ，ChatGPT 只 能 够 正确 回答 少 部 分 问题 ， 并 未 能 够 通过 考试 。 研 究 "发 
Il ChatGPT 虽然 可 以 高 效 地 用 各 种 方式 解释 许多 概念 ， 形 象 地 描述 抽象 概念 ， 
但 是 不 能 够 真正 将 概念 联系 起 来 。 相 反 ， 它 可 能 会 有 理 有 据 地 给 出 错误 信息 。 
4.3ChatGPT 在 医疗 领域 的 应 用 


72 https://arxiv.org/abs/2301.11305 

73 Could an Artificial-Intelligence agent pass an introductory physics course? : https://arxiv.org/abs/2301.12127 

74 ChatGPT Goes to Law School. Available at SSRN, 2023. 

75 Performance of ChatGPT on USMLE: Potential for Al-assisted medical education using large language models[J]. PLOS Digital Health, 2023, 2(2): e0000198. 


76 ChatGPT and Software Testing Education: Promises & Perils: https://arxiv.org/abs/2302.03287 


77 AI Insights into Theoretical Physics and the Swampland Program: A Journey Through the Cosmos with ChatGPT https://arxiv.org/abs/2301.08155 
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ChatGPT 等 人 工 智 能 技术 的 应 用 有 望 改 善 现 有 的 医疗 水 平 , 让 医疗 技术 更 加 
智能 化 、 高 效 化 、 个 性 化 。 目 前 ， 有 一 些 研究 已 经 开始 探索 ChatGPT 在 医疗 报 
告 简化 生成 、 医 疗 决策 、 医 患 沟通 等 应 用 上 的 可 行 性 。 
4.3.1 ChatGPT 用 于 报告 编写 和 信息 提取 

研究 ?使 用 ChatGPT 进行 医疗 报告 的 简化 工作 ， 并 邀请 15 位 放射 科 医 生 对 
简化 结果 进行 质量 评估 ， 大 多 数 报告 被 认为 是 真实 的 、 正 确 的 和 没有 危害 的 ， 少 
部 分 存在 忽略 关键 医疗 结果 的 问题 。 研 究 ” 通 过 对 医学 文献 和 医疗 对 话 数据 的 分 
WT, 设计 了 一 种 能 够 通过 GPT-3 模型 自动 生成 医疗 对 话 摘要 训练 语 料 的 方法 ， 
并 证 明了 其 生成 的 摘要 语 料 对 于 摘要 模型 的 监督 训练 有 较 好 的 帮助 。 研 究 8 探 讨 
了 GPT-3 模型 在 生物 医学 领域 的 Few-shot 学 习 能 力 ， 即 当 样 本 数量 很 少时 ， 
GPT-3 模型 在 预测 生物 医学 实体 、 预 测 药物 -基因 关系 、 回 答 生 物 医学 问题 等 任 
务 中 的 表现 ， 与 传统 的 基于 规则 或 基于 统计 的 方法 相 比 没有 优势 。 研 究 3 实 验 了 
GPT-3 模型 在 生物 医学 信息 提取 中 的 应 用 ， 发 现 GPT-3 模型 虽然 可 以 生成 一 些 
看 起 来 合理 的 实体 、 关 系 和 事件 ， 但 是 其 表现 并 不 理想 。 
4.3.2 ChatGPT 用 于 诊断 决策 和 分 流 

研究 2 探索 了 ChatGPT 在 放射 学 决策 中 的 可 能 用 途 ， 并 表明 ChatGPT 在 确 
定 需要 进行 乳腺 癌 和 乳房 疼痛 病人 的 成 像 检查 决策 中 取得 了 较 好 的 结果 , 鉴于 放 
射 学 决策 的 复杂 程度 ， 作 者 认为 ChatGPT 可 以 作为 的 放射 学 决策 的 辅助 工具 。 


在 ChatGPT 之 前 ， 还 有 一 些 基于 GPT-3 等 模型 的 研究 。 研 究 2 探讨 了 GPT-3 模 


78 ChatGPT Makes Medicine Easy to Swallow: An Exploratory Case Study on Simplified Radiology Reports: https://arxiv.org/abs/2212.14882 
79 Medically Aware GPT-3 as a Data Generator for Medical Dialogue Summarization https://arxiv.org/abs/2110.07356 

80 GPT-3 Models are Poor Few-Shot Learners in the Biomedical Domain https://arxi /abs/2109.02555 

81 Thinking about GPT-3 In-Context Learning for Biomedical IE? Think Again https: v.org/abs/2203.08410 


82 Evaluating ChatGPT as an Adjunct for Radiologic Decision-Making.: https://www.medrxiv.org/content/10.1101/2023.02.02.23285399v 1 


83 The Diagnostic and Triage Accuracy of the GPT-3 Artificial Intelligence Model https://www.medrxiv.org/content/early/2023/02/01/2023.01.30.23285067 
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型 在 医学 诊断 和 分 流 方面 的 准确 性 ， 发 现 GPT-3 在 某 些 疾病 的 诊断 和 分 流 上 表 
现 得 较 准确 ， 例 如 COVID-19， 心 脏 病 等 ， 但 是 无 法 适应 一 些 特定 的 病例 。 
4.3.3 ChatGPT 用 于 医 患 沟通 

为 评价 AI 聊天 机 器 人 用 于 医 患 沟通 的 可 能 性 ， 研 究 * 评 估 了 使 用 ChatGPT 
回答 医疗 问题 的 效果 。 对 于 患者 的 问题 ，ChatGPT 和 供应 商 分 别 给 出 答复 , 再 让 
患者 对 答复 进行 类 别 区 分 ， 结 果 显 示 来 自 ChatGPT 的 答复 还 是 供应 商 的 答复 几 
乎 相同 ,外 行人 基本 相信 了 聊天 机 器 人 回答 的 低 风 险 健康 问题 。 但 是 随 着 问题 的 
医学 复杂 度 提升 ， 可 信和 度 会 随 之 降低 。 研 究 5 探 讨 了 ChatGPT 在 神经 退行 性 疾病 
诊断 因果 发 现 问答 上 的 效果 , 结果 也 是 类 似 , ChatGPT 只 能 理解 通常 用 于 描述 情 
况 的 语言 ， 而 不 理解 复杂 的 医学 术语 ， 比 如 不 能 识别 T12 神经 根 病 引起 的 下 腹 
部 不 适 等 病症 。 
4.4ChatGPT 在 信息 领域 的 应 用 

ChatGPT 诞生 于 信息 领域 ， 也 最 先 冲 击 到 信息 科技 行业 。 目 前 ， 已 有 多 家 信 
息 科 技 企业 在 内 部 对 ChatGPT 的 使 用 场景 进行 了 探索 ， 以 辅助 编程 人 员 高 效 开 
发 ; 同时 有 企业 在 其 落地 应 用 中 实 装 ChatGPT 插件 ， 来 为 用 户 提供 更 加 个 性 化 
的 服务 。 
4.4.1 ChatGPT 用 于 搜索 引擎 

传统 的 搜索 引 警 是 基于 关键 词 匹配 搜索 结果 ， 而 ChatGPT 可 以 在 自然 语言 
和 语义 理解 的 基础 上 , 通过 会 话 的 方式 进行 搜索 检索 , 使 用 户 拥有 更 好 的 搜索 体 
验 。 微 软 推出 了 全 新 的 、 由 人 工 智 能 驱动 的 Bing ( 必 应 ) 搜索 引擎 和 Edge 浏览 


84 Putting ChatGPT's Medical Advice to the (Turing) Test: https://arxiv.org/abs/2301.10035 


85 Causal-Discovery Performance of ChatGPT in the context of Neuropathic Pain Diagnosis: https://arxiv.org/abs/2301.13819 


器 ， 用 以 提供 更 好 的 搜索 、 更 完整 的 答案 、 新 的 聊天 体验 和 生成 内 容 的 能 力 *。 
微软 公司 已 经 开发 了 一 种 与 OpenAI 模型 合作 的 Prometheus 模型 , 这 种 组 合 为 用 
户 提供 更 相关 、 更 及 时 和 更 有 针对 性 的 结果 ， 并 提高 安全 性 。 将 人 工 智能 模型 应 
用 于 核心 必 应 搜索 排名 引擎 , 实现 了 二 十 年 以 来 相关 性 检索 的 最 大 跳跃 , 即便 是 
基本 的 搜索 查询 也 更 准确 、 更 相关 。 微 软 将 搜索 、 浏 览 和 聊天 整合 成 一 个 统一 的 
体验 ， 使 用 户 可 以 从 网 络 的 任何 地 方 调 用 ， 提 供 更 好 的 服务 内 容 。 
4.4.2 ”ChatGPT 用 于 代码 生成 和 错误 修复 

ChatGPT 可 以 根据 用 户 编程 的 需求 直接 生成 代码 , 同时 也 可 以 帮助 用 户 检索 
已 有 代码 存在 的 错误 。 除 了 python、Java 等 常规 代码 编写 语言 外 ，ChatGPT 也 可 
以 生成 一 些 特殊 代码 ， 如 论文 检索 式 。 它 是 一 种 由 检索 词 、 逻 辑 算 符 等 元 素 组 成 
的 代码 语言 , 研究 ?实验 了 ChatGPT 在 生成 论文 检索 式 方面 的 性 能 , 结果 显示 它 
能 够 生成 搜索 精度 较 高 但 召回 率 较 低 的 检索 式 , 可 以 作为 研究 人 员 快 速 进行 系统 
性 综述 工作 的 辅助 工具 。 修 复 软件 源 代码 中 的 错误 是 一 项 重要 且 复 杂 的 工程 , 自 
动 修复 源 代码 不 仅 可 以 提高 开发 效率 , 而 且 能 降低 维护 成 本 。 在 代码 错误 修复 方 
面 , ChatGPT 也 表现 出 了 较 大 的 潜力 。 研 究 %* 评 估 了 ChatGPT 在 程序 错误 修复 方 
面 的 性 能 ， 并 发 现 ChatGPT 的 表现 优 于 现 有 最 佳 的 模型 。 
4.5ChatGPT 在 其 他 领域 的 应 用 

更 多 行业 领域 也 对 ChatGPT 的 应 用 进行 了 探索 。 尤 其 是 内 容 和 游戏 产业 本 
身 就 伴随 于 互联 网 发 展 而 诞生 ， 对 ChatGPT 的 嵌入 式 应 用 有 着 先天 的 优势 。 


4.5.1 ChatGPT 用 于 内 容 创作 


86 https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/ 
87 Can ChatGPT Write a Good Boolean Query for Systematic Review Literature Search?: https://arxiv.org/abs/2302.03495 


88 An Analysis of the Automatic Bug Fixing Performance of ChatGPT: https://arxiv.org/abs/2301.08653 


作为 文本 生成 模型 ,ChatGPT 及 类 似 模型 开辟 了 一 个 新 的 内 容 创 作 时 代 , 能 
够 凭借 大 规模 语 料 构思 、 润 色 、 续 写 、 改 写 、 翻 译 等 方面 辅助 创作 者 ， 也 可 以 直 
接 与 需求 用 户 对 接 , 通过 问答 生成 和 人 工 筛选 的 方式 构建 有 价值 的 内 容 , 例如 写 
诗 、 写 歌 . 写 广告 语 。 美 国 新 闻 聚 合 网 站 BuzzFeed 去 年 12 月 解雇 了 180 名 员工 ， 
将 改 用 OpenAI 的 ChatGPT 以 “增强 ”和 “个 性 化 ”其 内 容 ”。 在 用 人 工 智 能 应 
用 到 新 闻 写 作 上 ，CNET 走 得 更 超前 ， 不 过 也 更 早 吃 到 了 “苦果 ”。 从 2022 年 
11 月 开始 ，CNET 开始 使 用 内 部 开发 的 AI 引擎 ， 生 成 了 77 篇 新 闻 报 道 ， 由 于 
其 中 超过 一 半 的 报道 包含 事实 错误 或 者 不 当 引用 ， 以 至 于 CNET 现在 停止 使 用 
这 个 人 工 智能 引擎 ”。 

4.5.2 ChatGPT 用 于 游戏 角色 

科技 是 推动 游戏 产业 发 展 的 核心 动力 , 而 游戏 产业 本 身 有 很 大 值得 深 挖 的 价 
值 ,可 作为 自由 度 较 高 的 完美 实验 场 应 用 各 种 新 技术 ”。2 月 15 日 消息 ， 网 易 旗 
下 开放 世界 武侠 手 游 《 逆 水 寒 》 宣 布 实 装 国内 首 个 游戏 版 类 ChatGPT 应 用 ,让 
智能 NPC (Non-Player Character) 能 和 玩家 自由 生成 对 话 ， 并 基于 对 话 内 容 ， 自 
主 给 出 有 逻辑 的 行为 反馈 2 . 这 也 是 国内 类 ChatGPT 首次 应 用 在 游戏 。 官方 表示 ， 
TEAK GPT DORE BR, BBE NPC 形成 巨大 的 社会 关系 网 ， 玩 家 的 每 一 个 行为 
都 可 能 产生 蝴蝶 效应 ,影响 这 个 网 。 据 介绍 , 游戏 中 智能 NPC 的 所 有 对 话 文字 、 
表情 、 语 音 、 镜 头 均 由 AI 自由 生成 ， 其 中 语音 为 临时 的 机 械 版 本 ， 待 正式 上 线 
时 还 会 根据 NPC 性 格 进行 迭代 提升 。 


4.5.3 ChatGPT 用 于 电 商 营销 、 智 能 客服 


89 https://new.qq.com/rain/a/20230201 AOSEJROO 

90 https://baijiahao. baidu.com/s?id=175623 1527688401672 

91 https://games.sina.com.cn/y/n/2023-02-15/myftyex6493826.shtml 
92 https://www.163.com/dy/article/HTKJ610G0511B8LM.html 


智能 客服 机 器 人 早已 在 电 商 领域 得 到 普遍 应 用 , 这 些 服务 机 器 人 可 以 在 人 工 
客服 接 入 之 前 ， 回 答 客户 常见 的 业务 咨询 问题 ， 大 大 提升 客服 的 接待 效率 ， 降 低 
人 工 客服 的 工作 量 。ChatGPT 聊天 机 器 人 能 力 的 介入 ,可 以 帮助 品牌 和 消费 者 建 
立 更 自然 、 内 容 更 丰富 和 个 性 化 的 客服 对 话 体系 。 此 外 ChatGPT 可 以 分 析 客 户 
的 购买 历史 和 偏好 ， 进 行 个 性 化 产品 推荐 ， 从 而 提高 转化 率 和 销售 额 。 利 用 其 出 
色 的 内 容 生成 能 力 ， 还 可 以 对 销售 产品 进行 描述 ， 突 出 产品 卖点 ， 做 内 容 营销 。 
2 月 10 日 ， 京 东 云 官 微 发 布 称 ， 旗 下 言 犀 人 工 智能 应 用 平台 将 整合 过 往 产 业 实 
践 和 技术 积累 ， 推 出 产业 版 ChatGPT,， 产 品名 字 叫 : ChatJD,， 在 公布 的 落地 应 用 
路 线 图 “125” 计 划 中 提 到 将 会 涉及 内 容 生 成 、 人 机 对 话 、 用 户 意图 理解 、 信 息 抽 
取 、 情 感 分 类 5 个 应 用 ”。 去 哪儿 上 线 的 类 ChatGPT 智能 问答 机 器 人 “万 能 Al 
小 骆驼 "， 可 以 帮助 用 户 定制 行程 、 解 答 旅行 中 的 难题 ， 已 收录 问题 涵盖 旅游 路 
线 推荐 、 景 区 厕所 、 误 食 菌 茹 等 。 

4.5.4 ChatGPT 用 于 工业 领域 任务 排 班 

ChatGPT 对 工业 领域 的 任务 排 班 等 应 用 也 有 潜在 的 可 用 性 。 研 究 ” 使 用 
ChatGPT 为 建筑 项 目 生 成 施工 计划 , 利用 人 类 反馈 机 制 , 组 织 一 批 参 与 者 对 输出 
结果 和 交互 体验 进行 评估 。 实 验 结果 显示 ChatGPT 可 以 根据 指定 的 范围 ， 生 成 
遵循 合理 任务 顺序 的 连贯 时 间 表 ,用 于 在 建筑 工业 任务 的 自动 执行 ,在 提高 工业 
效率 方面 有 很 大 潜力 。 


5 人 工 留 能 技术 迅速 发 展 市 来 的 启示 


以 ChatGPT 为 代表 的 人 工 智 能 技术 近年 取得 飞速 突破 ， 相 关 成 果 广 泛 应 用 


93 https://www.sohu.com/a/639240675_ 121286085 


94 Investigating the use of ChatGPT for the scheduling of construction projects: —_ https://arxiv.org/abs/2302.02805 


于 各 个 领域 ， 对 社会 各 行业 都 产生 了 巨大 冲击 。 

总 结 近 十 余年 来 人 工 智能 的 主要 发 展 历程 , 我 们 认为 人 工 智能 取得 突飞猛进 
的 根本 原因 在 于 计算 机 学 习 知识 、 开 发 利用 知识 的 模式 已 经 改变 。 能够 从 各 类 数 
所 资源 (att) 中 快速 高 效 地 学 习 到 隐藏 于 这 些 数 据 资 源 中 的 知识 是 AI 飞速 突 
破 的 本 质 所 在 。 

以 ChatGPT 为 代表 的 AI 技术 的 迅速 发 展 源 于 知识 学 习 能 力 的 大 幅 提升 , 它 


带 来 的 启示 如 下 : 
5.1 计 算 机 解决 间 题 模式 已 改变 , 机 器 学 习 成 为 获取 解决 问题 
所 需 知识 的 重要 手段 


机 器 学 习 改变 了 计算 机 解决 问题 的 模式 。 原来 是 人 输入 知识 让 机 器 解决 问题 ; 
而 现在 , 是 让 机 器 从 相关 语 料 中 学 习 知 识 , 再 让 机 器 利用 学 习 到 的 知识 去 解决 相 
关 的 问题 。 在 这 一 过 程 中 ， 隐 藏 着 重要 人 类 知识 的 大 样本 训练 语 料 至 关 重 要 。 这 
些 以 语 料 为 表征 的 人 类 知识 才 是 机 器 学 习 取得 飞速 突破 的 关键 
5.2 深 度 学 习 的 性 能 提升 ， 除 模型 突破 之 外 ,更 要 归功 于 语 料 
和 算 力 

各 类 深度 学 习 模型 是 基础 ， 大 量 可 计算 数据 资源 (训练 语 料 ) 是 前 提 ， 大 规 
模 计算 能 力 是 催化 剂 。 拥 有 大 样本 训练 语 料 和 大 规模 计算 能 力 ,使 得 基于 人 工 神 
经 网 络 深度 学 习 的 知识 学 习性 能 大 幅 提升 。 
5.3 自 然 语言 处 理 的 技术 已 经 重 写 , 无 监督 的 预 训练 对 于 知识 
学 习 有 重要 价值 

基于 预 训练 (Pre-Training) 和 微调 (Fine-Tuning) 的 两 阶段 学 习 方法 ， 改 写 
了 自然 语言 处 理 (NLP) 方式 ， 无 监督 的 预 训练 具有 重要 价值 。 利 用 大 规模 非 标 


注 语 料 的 无 监督 的 预 训练 ,能够 使 模型 从 语 料 中 学 习 到 语言 表达 模式 、 文 字 前 后 
逻辑 、 知 识 元 间 关 系 等 知识 内 容 , 提高 了 模型 的 泛 化 能 力 和 和 鲁 棒 性 。 在 此 基础 上 
只 用 少量 标注 语 料 进行 微调 ， 即 可 在 特定 下 游 任务 中 取得 较 好 的 效果 。 
5.4ChatGPT 并 不 是 无 来 由 的 横 空 出 世 ， 而 是 学 习 能 力 从 量 
变 到 质变 的 重大 突破 

回顾 历史 来 看 , 从 最 初 的 1.17 亿 参 数 、5GB 语 料 、12 Æ Transformer 的 GPT-1 


$ 


模型 ， 到 目前 的 1750 亿 参 数 、45TB 语 料 、96 层 Transformer、 采 用 人 类 反馈 强 
化 学 习 的 ChatGPT 模型 。ChatGPT SIRS, RH. BA, AIA 
累 而 成 的 。 人 工 智能 知识 学 习 能 力 上 ,每 一 个 小 小 的 进步 都 是 有 价值 的 ， 久 久 为 
功 ， 不 断 进 步 ， 最 终 实现 了 从 量变 到 质变 的 转换 。 
5.5ChatGPT 是 集成 创新 的 成 果 ， 学 习 能 力 的 提升 得 益 于 软 
件 、 硬 件 、 技 术 、 语 料 的 有 效 集成 

为 了 适应 模型 参数 量 的 激增 ，OpenAI 收集 、 标 注 了 更 多 的 原始 训练 语 料 ; 
为 了 实现 更 贴近 人 类 的 对 话 效果 , 研发 了 基于 人 类 反馈 的 强化 学 习 方 法 ; 为 了 加 
速 模型 训练 ,部署 了 28 万 个 CPU 内 核 、1 万 个 GPU 的 超级 计算 机 。 通 过 软件 、 
硬件 、 技术、 语 料 有 效 的 集成 , 才 使 得 ChatGPT 的 知识 学 习 能 力 获得 质 的 飞跃 ， 


造就 了 当前 ChatGPT 出 色 的 表现 。 


6 ChatGPT 对 科学 研究 和 文献 情报 工作 的 影响 

以 ChatGPT 为 代表 的 人 工 智能 技术 的 巨大 应 用 潜力 表明 了 其 或 将 对 各 个 领 
域 的 各 个 方面 带 来 颠覆 性 的 影响 。 本 节 主 要 探讨 其 对 科学 研究 所 带 来 的 范式 变革 
以 及 对 文献 情报 工作 的 直接 冲击 和 深远 影响 。 
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6.1ChatGPT 对 科学 研究 的 影响 

目前 ， 以 ChatGPT 为 典型 代表 的 人 工 智能 技术 展现 出 巨大 的 应 用 潜力 ， 可 
能 颠覆 传统 的 科学 研究 方式 ,以 人 工 智能 为 科研 基础 的 新 范式 正在 形成 。 面向 科 
学 研究 过 程 ，ChatGPT 在 科学 研究 知识 获取 、 科 学 实验 规划 、 研 究 成 果 撰写 等 多 
方面 可 为 科研 工作 人 员 提 供 更 进一步 的 支撑 。 同 时 , 我 们 也 要 充分 关注 人 工 智能 
带 来 的 科研 伦理 、 公 平 性 等 问题 ,建立 健全 相关 政策 法 规 , 让 科学 研究 在 正确 的 
轨道 上 合理 运用 人 工 智能 技术 。 
6.1.1 ”改变 科学 研究 范式 ， 推 动 科学 研究 从 第 四 范式 到 新 科研 范式 

在 人 类 科学 发 展 史 中 ,， 科学 研究 已 经 历 了 4 个 范式 的 变迁 ， 从 第 一 范式 (经 
验 范式 ) 到 第 二 范式 (理论 范式 ) ， 再 到 第 三 范式 (模拟 范式 ) ， 再 到 第 四 范式 

(科学 大 数据 、 数 据 密集 型 范式 ) 。 科 学 研究 范式 的 变化 本 质 上 是 科学 研究 基础 

驱动 力 的 进步 ， 以 ChatGPT 为 典型 代表 的 人 工 智能 技术 ， 即 将 渗入 科学 研究 各 
个 环节 ,成 为 驱动 科学 研究 发 展 的 新 动力 ,推动 科学 研究 进入 新 科研 范式 (人工 
智能 范式 ) 时 代 。 
6.1.2 ”改变 科学 研究 知识 获取 模式 ， 促 进 检索 模式 向 间 答 模式 升级 

传统 知识 获取 方法 主要 通过 搜索 引擎 服务 , 以 检索 关键 词组 合 筛选 .分 面 、 
排序 的 方式 获取 文献 资源 。 通常 需要 用 户 进行 多 次 过 滤 、 更 换 检索 条 件 对 结果 进 
行 凝练 ,最 后 还 需 人 工 逐 篇 浏览 挑选 文献 资源 。 实 际 应 用 中 ,该 知识 获取 过 程 消 
耗 时 间 较 长 ， 更 大 的 问题 是 存在 检索 不 全 的 缺点 。 如 果 检索 词 与 文献 用 词 不 同 ， 
那么 属于 同 主题 的 文献 不 会 被 检索 出 来 , 影响 科研 工作 者 对 研究 态势 的 判断 。 而 
基于 人 工 智能 大 模型 的 问答 式 知识 服务 , 将 不 止 是 一 种 信息 服务 系统 ,而 更 像 是 
一 个 具有 丰富 知识 的 “人 ”, 他 能 理解 用 户 的 语义 表达 , BE "IME" 用 户 的 提问 ， 
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能 “回答 ”以 给 出 结果 。 用 户 向 他 提问 实际 问题 ， 可 得 到 比 传统 知识 检索 系统 更 
准确 、 更 全 面 的 结果 。 
6.1.3 ”改变 科学 研究 实验 设计 模式 ， 辅 助 进行 实验 规划 和 设计 
实验 设计 是 科学 研究 的 关键 环节 ， 是 验证 创新 性 的 关键 手段 。 规 划 科学 、 合 
理 的 实验 过 程 ， 设 计 详细 的 实验 模型 ， 明 确实 验 环境 、 仪 器 、 软 件 等 的 正确 操作 
方法 ， 需 要 科研 工作 者 具有 丰富 的 经 验 、 大 量 的 知识 储备 。 尤 其 对 于 尝试 型 重复 
实验 ， 需 要 定义 变量 指标 ， 剂 量 控制 等 ， 需 要 花费 较 多 时 间 、 精 力 ， 才 能 形成 较 
全 面 的 实验 规划 。 面向 细 粒 度 语义 知识 元 的 人 工 智能 系统 ， 通 过 对 科学 研究 文献 
进行 系统 性 训练 ， 形 成 高 质量 科学 研究 实验 大 模型 ， 对 科学 实验 的 整体 规划 、 模 
型 设计 、 参 数 设置 、 环 境 要 求 等 给 出 建议 ， 并 能 与 用 户 进行 交互 式 调整 ， 形 成 实 
验 计划 。 智 能 系统 还 能 提供 循 证 功能 ， 辅 助 形成 科学 实验 的 证 据 链条 ， 保 障 科学 
研究 的 完整 性 。 在 不 久 的 将 来 ,智能 系统 辅助 科研 工作 者 设计 科学 实验 , 直接 对 
接 实验 机 器 人 开展 实验 ， 这 或 许 会 成 为 一 种 常态 。 
6.14 ”改变 科学 研究 成 果 写 作 模 式 ， 为 成 果 论文 撰写 提供 帮助 
《自然 》 杂 志 援引 美国 宾 儿 法 尼 亚 大 学 研究 员 皮 维 多 里 的 话 指出 ， 类 似 
ChatGPT 的 生成 式 大 规模 语言 模型 技术 的 运用 , 能 帮助 研究 人 员 更 高 效 地 编辑 手 
稿 .检查 代码 , 并 进行 头脑 风暴 ”。 类 ChatGPT 人 工 智能 作为 内 容 创作 智能 助手 ， 
对 研究 背景 、 研 究 前 沿 进展 、 研 究 关 键 问题 、 核 心 方案 及 实验 结果 论证 给 出 推荐 
内 容 ， 辅 助 科研 工作 者 高 效 撰写 科研 成 果 文 献 。 
6.1.5” 带 来 科研 伦理 问题 ， 须 建立 健全 政策 法 规 


95 (12 封 私信 /80 条 消息 ) 横 空 出 世 的 ChatGPT 爆 火 ， 微 软 谷歌 百度 纷纷 加 入 Al 战局 ， 你 看 好 人 工 智能 的 应 用 发 展 吗 ? - 知 乎 (zhihu.com) 
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现在 已 经 有 人 工 智能 工具 可 以 预测 一 篇 文章 是 来 自 机 器 还 是 人 类 的 可 能 性 。 
这 类 工具 对 于 检测 是 否 利 用 LLMs 制造 内 容 很 有 用 , 但 这 类 检测 方法 很 可 能 被 进 
化 的 人 工 智能 技术 和 巧妙 的 提示 所 规避 。 科 学 研究 应 该 以 诚信 、 透 明 的 方式 使 用 
人 工 智能 大 语言 模型 , 而 不 是 在 人 工 智能 机 器 人 和 人 工 智能 检测 器 之 间 进 行 不 可 
控 的 技术 竞技 ,研究 论文 中 的 作者 贡献 声明 和 致谢 应 该 清楚 而 具体 地 说 明 作者 在 
准备 稿件 和 分 析 时 是 否 使 用 了 ChatGPT 等 AI 技术 以 及 使 用 的 程度 。 科 学 研究 机 
构 、 出 版 商 和 资助 者 应 该 制定 明确 政策 , 约束 对 话 式 人 工 智能 在 科学 研究 过 程 中 
的 使 用 条 件 、 程 度 ， 并 要 求 其 透明 ， 让 科学 研究 在 公开 、 公 平 的 环境 和 氛围 中 开 
展 。 
6.2ChatGPT 对 文献 情报 工作 的 影响 

文献 情报 领域 是 ChatGPT 发 挥 智 能 作用 的 主 战场 之 一 ， 以 数 智 驱动 为 主要 
特征 的 新 情报 分 析 范式 ， 已 开始 向 多 模 态 、 多 类 型 、 细 粒度 知识 元 的 智能 情报 方 
向 深耕 。 类 ChatGPT 人 工 智 能 系统 在 智能 问答 、 情 报 分 析 、 内 容 创 作 、 数 据 分 
析 、 论 文 阅读 等 方面 与 文献 情报 工作 有 巨大 融合 空间 。 我 们 有 理由 相信 新 一 代 类 
ChatGPT 人 工 智能 技术 对 文献 情报 工作 将 会 带 来 多 层次 . 多 应 用 场景 的 直接 冲击 
和 深远 影响 ， 禁 止 、 抵 制 的 方式 从 来 不 是 发 展 之 路 ， 应 用 好 、 管 控 好 人 工 智能 技 
术 才 是 文献 情报 事业 发 展 该 有 的 选择 。 
6.2.1 ”改变 文献 情报 数据 组 织 方式 , 从 表面 信息 组 织 到 语义 内 容 组 织 

科技 文献 情报 原始 的 组 织 方式 往往 以 题目 、 摘 要 、 关 键 词 、 机 构 、 期 刊 等 表 
面 信息 组 织 为 主 ， 较 少 深入 到 文献 内 容 中 。 随 着 AI 技术 发 展 ， 从 科技 文献 中 精 
确 挖掘 细 粒 度 知识 对 象 的 能 力 得 到 提升 ， 以 科技 文献 中 研究 问题 、 研 究 方法 、 实 
验 步 又、 数据 资料 等 深入 到 文献 内 容 的 语义 内 容 组 织 成 为 可 能 。 
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6.2.2 ”改变 文献 情报 知识 获取 模式 ， 从 信息 检索 到 知识 问答 

目前 , 文献 情报 知识 获取 服务 主要 基于 文献 元 数据 , 通过 搜索 引擎 技术 实现 
对 海量 科技 文献 数据 的 检索 与 获取 。 但 对 于 文献 检索 的 目标 , 元 数据 模式 限制 了 
用 户 对 文献 知识 的 充分 利用 。ChatGPT 可 以 在 语义 层面 理解 论文 内 容 , 抽取 、 结 
构 化 细 粒 度 知 识 元 ,进而 构建 大 规模 知识 网 络 ， 形 成 智能 知识 服务 。 用 户 可 以 基 


读 、 分 析 时 间 。ChatGPT 推动 了 从 索引 式 信息 检索 方式 向 问答 式 知识 应 答 方式 的 
转变 。 在 未 来 ， 或 许 能 够 实现 一 种 新 型 的 知识 问答 服务 ， 即 用 户 向 智能 知识 服务 
平台 提问 后 ， 平 台 能 够 直接 生成 该 问题 的 答案 ， 并 给 出 答案 的 相关 证 据 链 。 
6.2.3 ”改变 文献 情报 分 析 方 法 ， 从 手工 作坊 到 大 规模 智能 分 析 

文献 情报 分 析 过 程 包括 对 问题 界定 、 数 据 源 清单 梳理 、 数 据 准备 、 关 键 信息 
提取 、 统 计 分 析 、 观 点 提炼 以 及 报告 撰写 等 一 系列 复杂 工作 ,过往 由 人 类 手工 完 
成 . 情报 分 析 本 身 的 复杂 性 限制 了 情报 分 析 人 员 的 生成 效率 ,尤其 在 “数据 为 王 ” 
的 时 代 ， 数 据 建设 和 智能 化 能 力 代表 了 情报 分 析 的 水 平 。 类 ChatGPT 人 工 智能 
技术 已 具有 内 容 核心 综述 能 力 、 场 景 问答 、 语 言 翻译 、 语 义 分 析 及 推荐 能 力 ， 通 
过 建设 文献 情报 分 析 大 模型 ， 具 有 观点 提炼 、 决 策 推荐 等 功能 ， 支 持 情报 分 析 工 
作 ， 为 情报 分 析 人 员 提供 更 多 思路 、 更 广 视野 ， 更 高 价值 知识 。 
6.2.4 ” 带 来 文献 情报 服务 安全 问题 ， 须 建立 风险 管控 机 制 

人 工 智能 的 应 用 给 文献 情报 服务 带 来 两 个 方面 的 问题 , 其 一 是 文献 情报 服务 
归属 权 的 问题 ， 其 二 是 伪 数 据 、 伪 造 事实 误导 情报 分 析 的 问题 。 服 务 安全 历来 都 
是 被 广泛 关注 和 争 抢 的 战略 制高点 , 当知 识 获 取 以 更 加 智能 化 的 问答 模式 运行 时 ， 
文献 情报 服务 所 有 者 能 很 容易 通过 用 户 行为 数据 , 实现 对 用 户 的 精准 画像 , 清楚 
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掌握 其 研究 问题 、 研 究 技 术 、 研究 进展 、 团 队 成 员 、 实验 设备 等 一 系列 天 键 信息 ， 
这 对 于 国家 科技 战略 安全 来 讲 ， 人 存在 重大 隐患 ， 因 此 ， 有 必要 建设 我 国 具有 完全 
控制 权 的 文献 情报 智能 服务 系统 ， 打 好 文献 情报 服务 安全 保卫 战 。 

有 学 者 提出 基于 科幻 小 说 训练 出 来 的 大 数据 模型 将 如 何 回答 人 们 提出 的 问 
题 , 可 想 而 知 ,结论 一 定 是 不 可 信 的 。 我 们 看 到 , 泛 知 识 化 大 模型 不 能 保证 回答 
质量 , 而 文献 情报 领域 对 数据 可 信和 度 具 有 更 高 的 要 求 ， 基 于 伪 数 据 、 伪 造 事实 生 
成 的 情报 报告 必然 是 不 可 信 的 。 若 采用 类 ChatGPT 等 国外 服务 得 到 的 相关 数据 ， 
辨别 数据 真 仿 、 事 实 真 伪 对 于 情报 分 析 人 员 难 以 实现 ， 因 此 , 掌握 智能 服务 的 数 
据 控 制 权 是 做 好 应 用 的 重 中 之 重 , 同时 , 建立 完善 的 数据 循 证 体系 ,附加 数据 证 
据 链 、 数 据 来 源 详情 ， 达 到 对 风险 的 有 效 管控 和 济源 。 
6.2.5 ”对 用 户 阅 读 习 惯 的 影响 ， 引 导 人 机 协同 阅读 新 模式 

阅读 大 量 文献 是 科研 工作 者 的 必要 工作 , 需要 付出 很 多 的 时 间 和 精力 , 尤其 
在 信息 大 爆炸 的 时 代 背 景 下 ,从 错综复杂 的 文献 资源 中 提炼 关键 信息 , 寻找 多 篇 
文献 中 的 潜在 关系 ,得 到 开展 科学 研究 的 重要 数据 和 技术 支撑 , 显得 更 加 费时 费 
力 。 类 ChatGPT 技术 可 能 对 用 户 阅 读 文献 资源 的 方式 囊 来 颠覆 性 的 影响 ,用户 
输入 待 读 文 献 资 源 , 智能 技术 自动 实现 知识 抽取 、 关 系 揭示 ,通过 可 视 化 方式 进 
ITRI, 支持 多 维度 的 统计 分 析 ， 并 以 交互 式 的 方式 应 答 用 户 的 问题 和 设 定 , FZ 
成 用 户 与 人 工 智 能 协同 阅读 的 新 模式 。 
6.2.6 ”对 传统 图 书 情报 工作 形成 挑战 , 需要 统筹 谋划 图 书馆 的 队伍 能 
力 与 岗位 体系 

人 工 智 能 对 传统 图 书 情报 工作 的 影响 是 多 方面 的 、 显 著 的 , 从 基础 的 书目 录 
入 、 文 献 数 据 传统 治理 、 客 服 解 答 、 代 码 撰 写 到 资讯 编辑 、 热 点 论文 推荐 、 书 评 
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推荐 、 动 态 感 知 、 情 报 分 析 等 都 会 不 同 程度 受到 人 工 智能 技术 的 影响 , 一 部 分 工 
作 将 被 人 工 智 能 优化 或 替代 , 从 客观 上 形成 有 些 岗 位 不 再 需要 那么 多 人 员 的 状态 。 
同时 , 我 们 也 应 该 看 到 人 工 智能 带 来 了 新 的 工作 机 会 , 更 多 智能 服务 的 工作 需要 
设置 新 的 岗位 ， 形 成 新 的 业务 方向 ， 扩 展 图 书 情报 工作 的 业务 范围 。 


7 对 文献 情报 领域 的 建议 

ChatGPT 重 在 内 容 生 成 ,而 文献 情报 工作 重 在 循 证 。ChatGPT 主要 解决 自然 
语言 处 理 中 内 容 生 成 的 问题 , 但 文献 情报 工作 的 重点 并 不 在 此 , 我 们 的 机 会 在 于 
如 何 循 证 ， 挖 掘 支撑 可 信 情 报 的 证 据 及 证 据 链 。 文 献 情报 工作 在 AI 时 代 要 找到 
自己 的 不 同 价值 取向 ,有 关 建 议 如 下 。 
7.1 文 献 情 报 领 域 要 把 从 科技 文献 内 容 中 挖掘 和 利用 知识 的 
能 力作 为 核心 能 力 来 建设 

科技 文献 蕴含 人 类 知识 、 表 达 科 学 机 理 、 揭 示 科研 成 果 , 是 国家 科技 创新 的 
核心 战略 资源 , 也 是 国家 科技 文献 情报 机 构 开展 知识 服务 和 科技 情报 研究 的 重要 
基础 。 目 前 利用 智能 技术 对 科技 文献 内 容 进 行 深度 挖掘 , 在 其 基础 上 支撑 智能 化 
的 知识 服务 和 情报 分 析 , 进而 支撑 科技 创新 和 战略 决策 已 成 为 重要 发 展 趋势 , 文 
献 情 报 领域 要 把 从 科技 文献 中 挖掘 和 利用 知识 的 能 力作 为 核心 能 力 来 建设 。 
7.2 充 分 认识 到 文献 情报 机 构 在 AI 时 代 的 优势 和 价值 

ChatGPT 再 次 告诉 我 们 , 高 价值 语 料 工 作 是 一 切 人 工 智能 的 基础 。 文 献 情报 
机 构 要 充分 认识 自己 在 AI 时 代 重 要 价值 和 新 的 定位 : AI 语 料 提 供 者 。 科 技 文献 
蕴含 大 量 知识 , 是 人 工 智 能 重要 的 基础 。 文 献 情报 行业 是 从 文献 中 获取 知识 的 行 
业 。 在 AI 时 代 , 我 们 应 当 充 分 借鉴 与 利用 ChatGPT 这 类 深度 学 习 模型 ， 将 科技 
文献 库 转 为 知识 库 。 利 用 知识 组 织 体系 、 编 目 数据 、 人 工 标 引 内 容 支持 科技 文献 
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的 挖掘 ,提高 知识 获取 的 能 力 。 文 献 情报 机 构 应 充分 认识 自己 在 新 时 代 的 使 命 和 
定位 ， 做 好 “ 语 料 ” 甚 础 工作 。 
7.3 充 分 加 强人 工 智能 新 技术 方法 的 研究 和 应 用 

BERT、ChatGPT 等 人 工 智能 新 技术 方法 突破 , 表明 一 代 又 一 代 的 AI 技术 还 
在 突飞猛进 。 文 献 情报 领域 不 能 浅 涯 辆 止 。 我 们 可 以 借鉴 ChatGPT 这 种 基于 自 
监督 预 训练 的 大 模型 结合 基于 少量 优质 数据 反馈 的 强化 学 习 技 术 , 形成 模型 和 数 
据 的 闭环 反馈 ,获得 进一步 的 技术 突破 的 研发 思路 , 加 强 从 文献 和 数据 提取 细 粒 
度 知识 的 能 力 。 通 过 掌握 新 的 技术 方法 ,提升 知识 挖掘 与 计算 能 力 ， 加 强 知识 获 
取 方 法 的 研究 和 应 用 。 
7.4 文 献 情报 领域 需 积极 参与 “专业 和 垂直 ”知识 系统 建设 

ChatGPT 开启 了 一 个 新 模式 , 带 来 了 强大 的 综合 性 问答 系统 ,而 针对 科学 领 
域 , 开展 更 加 深入 的 专业 化 知识 内 容 获取 与 分 析 的 技术 方法 研究 , 还 存在 很 多 可 
以 开拓 的 空间 。 文献 情报 机 构 的 主要 任务 是 服务 科研 ， 因 此 我 们 要 抓 住 机 会 , 挖 
JE ChatGPT 能 够 在 专业 和 垂直 领域 能 够 带 来 的 价值 。 为 实现 这 一 目标 ， 我 们 需 
要 利用 自身 专业 领域 科技 文献 优势 ,积极 参 与 “专业 和 垂直 ”知识 系统 建设 ， 针 
对 某 一 具体 的 学 科 和 研究 领域 , 面向 该 领域 内 科研 人 员 的 实际 需求 , 开发 能 够 满 
足 实际 应 用 的 知识 服务 系统 。 
7.S 文 献 情报 领域 要 努力 创新 知识 服务 模式 

在 ChatGPT 的 相关 应 用 中 ， 已 经 可 以 实现 在 问答 过 程 中 进行 检索 ， 这 对 传 
统 的 信息 检索 模式 造成 了 极 大 的 冲击 , 也 为 检索 范式 的 变革 带 来 了 新 的 机 遇 。 文 
献 情 报 机 构 理 应 看 到 这 种 机 遇 缘 后 的 友 展 价值 ， 即 充分 利用 新 思路 、 新 技术 、 新 
模式 、 新 方法 ,改进 现 有 的 信息 检索 服务 范式 ,并 在 此 基础 上 主动 探索 知识 服务 
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的 新 形式 和 新 应 用 。 例 如 , 面向 知识 获取 场景 的 问答 式 知识 检索 , 面向 阅读 辅助 
场景 的 科技 文献 集 的 自动 综述 等 。 
7.6 应 用 ChatGPT 在 情报 研究 工作 上 启发 创意 

在 应 用 实例 中 已 经 证 实 了 ChatGPT 能 够 提供 启发 性 的 观点 和 创意 ， 例 如 在 
ChatGPT 和 DALLE 的 联合 应 用 当中 ，ChatGPT 能 够 输出 启发 性 的 文本 来 指导 
DALLE 进行 智能 绘画 。 从 这 一 例子 当中 ,可 以 看 到 ChatGPT 的 启发 性 作用 。 
此 ， 我 们 可 以 利用 ChatGPT 这 种 生成 式 、 启 发 性 的 对 话机 制 ， 在 情报 研究 工作 
中 寻求 新 的 方向 、 新 的 问题 和 新 的 视角 等 内 容 。 但 需要 额外 注意 的 一 点 是 ， 
ChatGPT 生成 的 内 容 缺 乏 真实 性 和 专业 性 方面 的 控制 , 因此 需要 有 具备 一 定 专业 
背景 知识 的 科研 人 员 和 领域 专家 来 指导 。 
7.7 情 报 的 溯源 和 真实 可 靠 性 检测 将 变 得 更 加 重要 

ChatGPT 出 现 之 后 ， 会 产生 更 多 由 ChatGPT 生成 的 “ 假 情报 ”， 情 报 的 漳 
源 和 真实 可 靠 性 检测 将 变 得 更 加 重要 。 滥 用 ChatGPT 可 能 会 带 来 错误 虚假 信息 
传播 、 信 息 泄露 、 抄 袭 等 一 系列 问题 。 情 报 工 作者 在 基于 ChatGPT 开展 服务 或 
者 进行 科研 时 ,需要 对 其 生成 答案 的 可 靠 性 进行 检测 , 保证 数据 来 源 的 真实 可 靠 。 
如 何 开 展 机 器 生成 内 容 的 情报 济源 以 及 真实 可 靠 性 检测 ， 值 得 进一步 研究 。 
7.8 要 进行 数据 资源 、 基 础 设施 、 智 能 技术 一 体 化 的 能 力 建设 

ChatGPT 这 样 真正 实现 应 用 的 AI 产品 ， 是 软 硬 件 以 及 各 种 技术 方法 有 效 集 
成 的 结果 ,文献 情报 工作 能 力 的 提升 , 要 统筹 数据 资源 的 积累 .基础 设施 的 升级 、 
智能 技术 的 研究 等 , 实现 各 方面 从 量 的 积累 到 质 的 飞跃 ,最 后 进行 一 体 化 的 有 效 
集成 ， 开 发 出 真正 好 用 、 耐 用 、 用 户 愿意 用 的 文献 情报 产品 。 

文献 情报 需要 自我 革新 , 拥抱 新 技术 与 新 机 会 。ChatGPT 作为 一 种 工具 , 6 
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本 身 不 会 打败 人 。 但 是 它 肯定 会 带 来 : 会 使 用 这 种 工具 的 人 打败 那些 不 会 使 用 这 
种 工具 的 人 ,传统 的 文献 情报 工作 依然 有 价值 , 但 新 技术 珊 来 改变 已 是 大 势 所 趋 。 
在 此 背景 之 下 ,文献 情报 领域 需要 守 正 创新 ,图 书 情报 研究 必须 把 握 机 遇 ， 既 要 
守 正 继承 传统 科学 研究 范式 ， 也 要 拓展 以 ChatGPT 等 新 技术 助力 科学 研究 。 
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